轻松分析阿里云OSS数据
MLSQL Engine 终于原生支持阿里云了。你现在只要花几分钟就能用MLSQL(或者分析工坊) 对OSS上的数据进行分析。与之配套的是,我们开通了analysis.mlsql.tech
域名,用户可以在这里创建一个基于阿里云的Engine.
具体原理是,用户提供一个具有在阿里云创建ASK权限的AccessKey,MLSQL Console会使用该AccessKey在用户的账号下创建对应的MLSQL Engine,系统会返回相应的访问地址和随机校验Token,然后用户在MLSQL Console 注册下这个地址和Token就能使用。
为了保证安全以及使用上的便利,我们建议用户新生成一个权限较大的AccessKey(开通了ASK权限的AccessKey),一旦集群创建成功后,用户就可以删除掉该Key.不过删除该Key后,如果用户想要关停,则需要手动在阿里云上进行关闭。
在阿里云上创建云引擎
注册登录后,进入设置页面:
在左侧菜单栏选择创建云引擎
:
填写相关信息:
OSS AccessKey是必须一直有效的,因为MLSQL Engine会将其作为底层分布式存储。 但AccessKey一旦集群创建完毕,就可以删除。避免发生泄露后造成损失。
点击确认后,就会进入一个日志界面,前十秒可能没有数据,大家稍微耐心,日志会自动刷新。途中红线框部分标记我们成功创建了一个Engine:
同时,在你的阿里云容器服务 - Kubernetes
控制台上也可以看到我们新创建的ASK集群,点击进去可以看到非常详细的MLSQL Engine相关的信息:
通常,你获得连接信息后,根据集群规模大小,可能需要等待一分到10分钟不等才能真正开始试用MLSQL Engine,原因是大量的容器创建需要一定的时间。用户可以在阿里云中看到更详细的情况。
当所有容器都处于running状态了,就ok了,如下图:
注册新创建的云引擎到MLSQL Console里
拿到上面的信息,就可以注册引擎信息到MLSQL Console了:
最后,将其设置为自己的默认引擎:
如果忘记了,也可以到这里查看:
删除云引擎
删除操作会把跑MLSQL Engine的ASK集群删除。这意味着我们会清理掉所有的Pod.所以不要手动在该ASK集群上跑出了MLSQL Engine以外的作业。
如果用户希望释放资源,可以删除引擎:
如果删除失败,可以主动到阿里云容器服务 - Kubernetes
控制台上进行删除。