【硅谷动态】 速度快20倍的捷豹大数据库
  2017-06-01     数据捷豹


捷豹数据库是快速存储大数据、检索信息、分析统计的新型高速有效数据平台。 对物联网、互联网、智能工业产生的大量数据, 捷豹数据库依托机群的快速响应能力,能接收存储每天几十亿甚至几百亿条的数据记录。 在接收数据的同时还对数据构建索引,让数据查询分析工作得以顺利实现。

说到大数据,我们有必要了解一下什么是物联网。物联网将是大数据的巨大来源。 物联网(Internet of Things,缩写IoT) 是资讯载体网络, 让所有具有独立功能的物体实现互联互通。物联网一般为无线网, 由于每个人周围的设备可以达到一千至五千个,所以物联网可能要包含500兆(兆=万亿)至一千兆个物体。 在物联网上,每个人都可以应用电子标签将真实的物体上网联结,在物联网上查出它们的具体位置和状态。 通过物联网可以用云中心对机器、设备、人员进行集中管理、控制,也可以对家庭设备、汽车进行遥控, 以及搜寻位置、防止物品被盗等。 物联网应用范围十分广泛, 其应用领域主要包括以下方面: 运输和物流领域、健康医疗领域,智慧环境领域,个人和社会领域, 具有十分广阔的市场和应用前景。

曾经的互联网,被人们称为万维网。未来的物联网真可谓是亿维互联。由于物联网的规模如此之大, 单单依靠人力资源不可能有效管理大量的互联物体,必须让机器来管理机器, 人工智能或机器智能的作用将得到充分发挥。人工智能可以通过捷豹数据平台,监控互联物体状况, 及时预测事故发生可能性,并对事后处理做到最大程度的自动化。



捷豹数据库到底有多强的能力? 让我们亲自动手实际体验一下吧。首先我们在实验室环境搭建一个由5个服务器组成的机群。 每个服务器配置是72G内存,2T磁盘,16核CPU,安装Centos6.7 操作系统,用1Gbps 网络路由器连接。 我们安装了捷豹数据库最新版本2.6.8.1, 同时也安装了当前市场上流行的Cassandra 数据库3.9版本,这样可以进行对比参照。 然后在捷豹数据库(Jaguar)和Cassandra数据库建立一个18字段的表,其中主键有20字节,其余有246字节。 建立表后,我们先后写入100万条数据记录和1000万条数据记录。数据录入后,我们再将其中一部分数据(50万条)查询出来。 在Cassandra和Jaguar写入数据时, 都把对方的数据清理干净, 免得所占资源造成影响。下面表格列出测试对比结果。

  写入数据   Cassandra   Jaguar
  1,000,000   1802 秒   105 秒
  10,000,000   18010 秒   1045 秒






数据写入时每一条记录都产生三份备份。Jaguar的用时相比之下少了很多,写入速度是Cassandra的18倍! 将数据写入之后,再把其中的50万数据查询出来,所花费的时间如下:

  Cassandra   Jaguar
  3604 秒   246 秒


从上面表格数据可以看出,Jaguar的数据查询也花费很少时间,速度是Cassandra的15倍!


不仅捷豹数据库将数据处理速度以数量级倍数提高,而且其简单易用易扩展。在此核心数据库产品基础上, 数据捷豹公司还整合现有其它大数据开源产品,例如Hadoop, Spark, Kafka, 深度学习算法等, 形成一套完整的大数据人工智能平台, 为物联网行业提供行之有效的解决方案。



数据捷豹公司简介 数据捷豹公司(DataJaguar, Inc)位于美国硅谷地区,办公室位于山若梦市(San Ramon), 这里聚集了大量的硅谷高科技人才。公司成立于2013年,致力于物联网新工业浪潮的尖端产品开发和服务, 为广大客户提供最优秀的产品和技术方案。公司的技术已经获得专利授权,欢迎有志之士加入合作,共创伟业。

公司网站 www.datajaguar.com