查看原文
其他

极海盒子-数据分析师的必备工具

吴泳峰 极海 2023-10-13


点击图片申请试用


8月22日,由极海主办的2019决策智能化转型峰会在北京圆满落幕,在本次峰会上,极海创始人兼CTO吴泳锋发布了极海新一代的智能数据产品极海盒子。以下为演讲实录:


大家好,今天由我来给大家介绍一下我们的一个全新的产品——极海盒子。这是一个全新的、软硬件结合的设备,是我们面向越来越明确的智能决策需求而推出的、新一代的智能数据产品。



回顾极海产品进化的过程,我们始终坚持的原则就是要围绕用户的需要,努力用最新的技术和理念来服务用户。我们最早在国内提供在线的企业级制图服务、最早提供开箱即用的各种地理计算的API、最早把数据开放并整合到在线服务。与此同时,我们也紧跟移动互联网、AI 的技术浪潮,并在第一时间落地到服务客户的实际场景中去。



在这个过程中,我们形成了功能完备的、中心化的云服务体系。


整个云平台在核心数据资源的基础上,开发了图形渲染、地理计算、大数据智能分析、行业应用等核心能力,然后通过容器化和微服务将这些技术融合在一起,以 API 和 Web 的形式提供出来。所以,我们可以在在线的云环境中,进行访问数据、可视化、分析计算、二次开发等工作。正因为强大的云平台的支撑,我们不但持续地为几万个用户同时提供服务,同时也在各处部署了几十套私有化的云服务,以满足客户对私有云的需求。



但是,不少用户对于在线中心化的方式有所疑虑,因为你必须把所有相关的资源放到集中的云环境当中来,而有些核心敏感的数据是不可以上传到云环境的,于是它们也很难和外部的数据进行碰撞、融合。私有云呢,一般又伴随着较大的立项、长周期的开发,这对于很多中小型的用户是不够友好的。因此,去中心化、把核心的运行环境切换到本地就是另一种很有价值的模式。



在这种模式下,云可以单向地向本地传输资源,而大量的计算和处理都在本地环境中进行,这就避免了数据保密的问题,也减轻了对在线环境的依赖,一旦资源同步到了本地,你甚至可以在没有网络的情况下进行工作。这个本地的运行环境就是我们的「极海盒子」。



从硬件上,极海盒子是ARM计算设备,它包含四核的CPU,有支持CUDA的GPU,它的计算能力相当于一个智能手机。从软件上,极海盒子是一套可以 OTA 更新的系统,是一整套完整的、统一的本地运行环境。



一旦将极海盒子通过 USB 和工作电脑相连,就可以马上从浏览器中进入盒子的操作界面。


我们把盒子的主要功能总结成 3 块主要的工作界面,分别是找数据、看数据、用数据,这分别代表了我们使用数据的不同目的和阶段。


  • 第一阶段找数据,就是从所有的数据资源中搜索可能对我有用的数据;

  • 第二阶段看数据,就是通过各种可视化的方式来对数据进行探索,初步选择和了解数据;

  • 第三阶段用数据,是在更具体的场景下进行数据的智能分析。

联系极海

申请试

找数据


在「找数据」中,极海盒子的数据资源包括云端数据私密数据两部分。


云端数据是极海在云端提供用户订阅的数据内容,私密数据则是用户自己的私密环境,凡是自己提供的数据,或者盒子计算的数据结果,都存放在私密数据中。


  • 云端数据


每一个云端的数据都有几个特点:OTA、有版本和多尺度。OTA 意味着可以随时对一个数据进行同步更新,使用盒子的用户就不必再面对部署数据这个过程;有版本意味着我们所有的数据更新都可以追溯、比较,甚至查看同一个数据随着时间的变化情况。


多尺度的意思是,我们每一个数据都包含了若干个尺度的不同数据内容,比如一个简单的星巴克咖啡厅数据,在最详细的尺度我们可以看到每一个星巴克的分布位置,而如果切换到街区尺度,我们则能看到每个街区中的星巴克分布数量和密度。多尺度的设计让我们的数据可以更好地描述现实世界,在不同观察尺度下的情况。



目前,在我们的云端包括了 6w 多个订阅数据集,这个数字还在不断增加。这些数据集包括了国家宏观、统计年鉴、人口、环境、住宅、办公、商业、公共配套等各种类别,基本已涵盖做线下地理分析所必需的数据。



我们还把自己生产的特色数据放在其中,比如自然街区。我们用 100多万个街区覆盖了全国所有的地块,比如等时圈,我们持续统计最近 3 个月的路况,支持进行更准确的道路环境分析。



  • 私密数据

关于「私密数据」,一个最简单的理解就是只许进不许出。你可以把自己的数据传输到「私密数据」中,使用盒子进行各种计算,其结果也存储到「私密数据」中,但是私密数据中的数据永远不会联网传输出去。这可以从最大限度上对用户的数据进行保护。


在私密数据中,支持几乎所有的数据格式,包括矢量、表格、遥感卫片、无人机影像等等。



看数据

第二阶段看数据,我们很多用户会感到很熟悉,这部分功能很大部分来自于云平台中的「数据上图」。



任何一个数据,无论是云端数据还是私密数据,都可以直接添加到「看数据」这个界面中来。



在「看数据」这个工作界面中,各种数据都在同一个工作空间中进行可视化,而且可视化的效果实时可调。同时,不同的数据可以在一起进行对比,寻找其中的相关性和其它规律。这本质上是现在大多数数据 BI 工具做的事情,在数据分析环节中相当于数据探索的过程。



当然,「看数据」还有一个重要作用就是表达数据结果,在盒子中,数据经过分析、计算产生了新的数据,新的数据又经过可视化、探索、再分析......这样反反复复进行碰撞、衍生,才能将数据的价值最大限度地发挥出来。

用数据

下面再来看看第三阶段「用数据」



「用数据」主要包括各种行业场景的数据分析模块,这些模块同样通过 OTA 的方式更新到本地、并直接运行。我们已经面向通用场景,还有零售、地产、规划等行业开发了若干用数据模块,比如零售里面做一些连锁业态的分析、销量的预测等等,地产做一些项目风险的评估等等。



每个模块都是一个完整的独立运行小环境,一般来说,每个模块中都会包含一个主要的运行镜像和一些相关资源。对于分析类型的模块,一般都只需要按照向导进行一些简单的数据选择、参数设置后,就可以启动运行了。模块运行结束后会把结果直接呈现出来,并按需要存储到私密数据中去。



还有一些展示型模块,也可以直接将成果配置成容易理解和操作的应用,同样可以快速地同步、运行。



对于盒子来说,面向新的场景不再存在复杂的系统开发和定制,只需要面向盒子开发一个「用数据」模块就可以了。在这个模块的背后,是我们通过业务理解的它背后的数据逻辑,用数据模块就是把这些数据逻辑固化到盒子中去。


亮点总结

总的来说,极海盒子可以让原来需要通过开发系统来满足的、高级的定制需求,转变为开发「用数据」模块,前者周期长风险高,后者则轻量、高效、风险低。



本质上,极海盒子的「找数据」主要就是帮助用户寻找到可能关联的数据;「看数据」对应市面上的 BI 工具,目的是将一些隐藏信息显性化,通过可视化、简单分析对数据进行探索;而「用数据」则真正提供智能化的分析能力,让我们可以用前沿的机器学习等技术对数据进行深度的挖掘和使用。


我们由衷希望,未来极海盒子可以成为城市管理者、地产分析师、规划师、零售优化师等等,相当于各个行业的数据分析师,他们的一个必备工具。


联系极海

申请试用




点击阅读原文,了解极海更多行业探索


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存