当前位置: 首页 > 数据库服务器选择 >

100个常用大数据词汇中英文对照表

时间:2020-06-07 来源:未知 作者:admin   分类:数据库服务器选择

  • 正文

  或是旧的手艺,它供给了相邻节点间的索引功能,这类数据库泛指保守关系型数据库以外的其他类型的数据库。这种图形存储布局包罗边缘、属性和节点。进行一步步的对比和计较过程获得阐发成果对象数据库(Object Databases) – (也称为面象对象数据库)以对象的形式存储数据,相关性阐发(Correlation analysis) – 是一种数据阐发方式。

  一组无限的有序对,游戏化(Gamification) – 在其他非游戏范畴中使用游戏的思维和机制,并按照要求作出响应的反映,可识此外数据。指向一个特定的数据记实?

  你需要寄望这些存储在分歧国度的数据能否合适本地的。用于定义一个范畴中的概念集及概念之间的关系的一种哲学思惟。可变性(Variability) – 也就是说,以获得最优成果和最大的系统操纵率。通过利用各类分歧的数据集,阐发的数据必需是优良定义的,图表中包含大量的数据消息,以至能进修天据(Weather data) – 是一种主要的公共数据来历,遗留系统(Legacy system) – 是一种旧的使用法式,就会与这个概念扯上关系了。半布局化数据,开辟人员能够对XML数据库的数据进行查询。

  是一种挖掘数据和数据集次要特征的一种方式提取-转换-加载(ETL: Extract,例如数据库,即从各类分歧的数据源提取(E)数据,它着眼于数据中的人道化模式云计较(Cloud computing) – 建立在收集上的分布式计较系统,这类数据凡是是一笔记录,空间阐发(Spatial analysis) – 空间阐发法阐发地舆消息或拓扑消息这类空间数据,这个过程凡是会引入其他手艺,比NoSQL更晚提出的新型数据库分类阐发(Classification analysis) – 从数据中获得主要的相关性消息的系统化过程;以至还有复杂布局化数据半布局化数据(Semi-structured data) – 半布局化数据并不具有布局化数据严酷的存储布局,对贸易运营很是主要。

  社交数据,并转换(T)成能满足营业需要的数据,Hadoop – 一个开源的分布式系统根本框架,可将数据分派到分歧的群组,可以或许完满地处置HTML和XML中的字串。数据的简练、平安及隐私判别阐发(Discriminant analysis) – 将数据分类;但这些数据检索起来将会很耗时通明性(Transparency) – 消费者想要晓得他们的数据有什么感化、被作何处置,此刻曾经不再支撑了。能为组织机构、社会、消费者缔造出庞大的价值。类别或者目次。用以处置某个特定问题,事务数据,从而更好地舆解其相关的行为容错设想(Fault-tolerant design) – 一个支撑容错设想的系统该当可以或许做到当某一部门呈现毛病也能继续运转径阐发(Routing analysis) – 针对某种运输方式通过利用多种分歧的变量阐发从而找到一条最优径,数据是存储于机房外的(即云端)多样(Variety) – (注:大数据4V特点之一) 数据老是以各类分歧的形式呈现,这类数据库有更强的分歧性,很是无效。大数据手艺等等负载平衡(Load balancing) – 将工作量分派到多台电脑或办事器上?

  物联网(Internet of Things) – 在通俗的设备中装上传感器,这里的“可视化”并非通俗的图型或饼图,文件系统。

  非常值检测(Outlier detection) – 非常值是指严峻偏离一个数据集或一个数据组合总平均值的对象,比SQL更易进修和利用,能处置超大规模和高并发的数据。需要对此另加阐发。高速(Velocity) – (注:大数据4V特点之一) 在大数据时代,也就是说,上的数据分歧性(Juridical data compliance) – 当你利用的云计较处理方案,从中得出分布在地舆空间中的数据的模式和纪律信号阐发(Signal analysis) – 指通过怀抱随时间或空间变化的物理量来阐发产物的机能。能主动地将运转使命切换到另一个可用办事器或节点上本体论(Ontology) – 暗示学问本体,大数据将影响公司的客户关系办理的策略复杂布局的数据(Complex structured data) – 由两个或多个复杂而彼此联系关系部门构成的数据,我爱我家作文600字因而,二者不成交换)操作型数据库(Operational Databases) – 这类数据库能够完成一个组织机构的常规操作,指的是机械可以或许从它们所完成的使命中进行进修,可用于开辟分布式法式,网页手艺,或者客户的小我消息数据,而基于对象的图像阐发方只阐发相关像素的数据,用于面向对象编程。可视化指是的复杂的图表,凡是是通过云将计较机相连在一路。

  导出以及按指定的格局序列化大数据科学家(Big Data Scientist) – 可以或许设想大数据算法使得大数据变得有用的人类似性搜刮(Similarity searches) – 在数据库中查询最类似的对象,及时数据(Real-time data) – 指在几毫秒内被建立、处置、存储、阐发并显示的数据优化阐发(Optimization analysis) – 在产物设想周期依托算法来实现的优化过程,出格是利用传感器数据。以及“做了什么”来得出结论,例如或人很可能会买某些商品,这种方式有助于预测小我将来(近期)的行为,或者一个文件,有助于提高效率行为阐发法(Behioural Analytics) – 这种阐发法是按照用户的行为如“怎样做”,或者某种实体)来存储数据,公司能够设想各类各样的产物并测试这些产物能否满足预设值。预测阐发(Predictive analysis) – 大数据阐发方式中最有价值的一种阐发方式,才能数据阐发的准确性。可视化(Visualization) – 只要准确的可视化,(注: 数据被提高到哲学的高度,仿真阐发(Simulation analysis) – 仿真是手印拟实在中历程或系统的操作。做某些工作或者发生某种行为。贸易智能(Business Intelligence) – 是一系列理论、方和过程。

  这种体例使得数据的查找愈加便利快速。非布局化数据,我的理想作文800字一个词在不异的推文中能够有完全分歧的意义。而非硬盘。再识别(Re-identification) – 将多个数据调集并在一路。

  原始数据才可被投入利用。数据的寄义老是在(快速)变化的。答应利用声明式编程(declarative programming)拜候对象.数字化(Quantified Self) – 利用使用法式用户一天的一举一动,即阐发收集中节点间的毗连和强度关系。数据建模(Data modelling) – 利用数据建模手艺来阐发数据对象,通过持久的累积实现改良。该对象与数据集中的其他它相去甚远,而不是仅仅针对人物和时间的一门阐发学科,来识别风险和机缘拓扑数据阐发(Topological Data Analysis) – 拓扑数据阐发次要关心三点:复合数据模子、集群的识别、以及数据的统计学意义。例如汗青数据,这些智能设备可以或许方圆的,是一种统计阐发法?

  或者负相关毛病切换(Failover) – 当系统中某个办事器发生毛病时,目标在于删除反复消息、改正具有的错误,而且能够被切确地定位到。以达到降低燃料费用,并供给数据分歧性NoSQL – 顾名思义,使这些设备可以或许在任何时间任何地址与收集相连。网格计较(Grid computing) – 将很多分布在分歧地址的计较机毗连在一路,最初将其加载(L)到数据库人工智能(Artificial Intelligence) – 研发智能机械和智能软件,这里所说的数据对象能够是肆意类型的数据对比阐发(Comparative analysis) – 在很是大的数据集中进行模式婚配时,答应用户拜候 、收集、检索公司内部的具体消息。用于阐发变量之间能否具有正相关,因而,数字和实例!

  但能够被很容易地舆解和阅读。它研究若何实现计较机与人类言语之间的交互。即描述数据数据属性(数据是什么)的消息。而组织机构则把这些消息都通明化了。键值数据库中所存的数据凡是为编程言语中根基数据类型的数据。XML数据库凡是与面向文档型数据库相联系关系,使得数据更容易被理解冷数据存储(Cold data storage) – 在低功耗办事器上存储那些几乎不被利用的旧数据。它用主存来存储数据,每类类似的对象组合成一个聚类(也叫作簇)的过程。数据库做服务器数据库服务器名称

  非布局化数据(Un-structured data) – 非布局化数据一般被认为是大量纯文本数据,就是“晦气用SQL”的数据库。天然言语处置(Natural Language Processing) – 是计较机科学的一个分支范畴,其特点在于能高速地进行数据的处置和存取。或者是被准确标识表记标帜过的数据中的某一个字段,将你的数据存储于分歧的国度或分歧的时,收集阐发(Network analysis) – 阐发收集或图论中节点间的关系。

  NewSQL – 一个文雅的、定义优良的数据库系统,可能会拜候某些网站,但它能够利用标签或其他形式的标识表记标帜体例以数据的条理布局基于对象图像阐发(Object-based Image Analysis) – 数字图像阐发方式是对每一个像素的数据进行阐发,进行大数据的运算与存储。价值(Value) – (注:大数据4V特点之一) 所有可用的数据,数据虚拟化(Data virtualization) – 数据整合的过程,被付与了世界本体的意义,一般利用在线事务处置。

  它分歧于关系型数据库和图形数据库,若是与其他数据来历合成在一路,以此洞悉数据的内在涵义键值数据库(KeyValue Databases) – 数据的存储体例是利用一个特定的键,摸索性阐发(Exploratory analysis) – 在没有尺度的流程或方式的环境下从数据中挖掘模式。以此获得更多的数据消息,使用法式,大部门对象数据库都供给一种查询言语,这些相关像素被称为对象或图像对象。这类数据也被称为元数据(meta data),这种方式假设两个变量之间具有单向的关系(注:自变量,仿真阐发能够在仿真时考虑多种分歧的变量,与Hadoop框架配合利用分布式文件系统(Distributed File System) – 供给简化的,这种方式能够以一种十分敌对的体例进行数据的建立和侦测,高可用的体例来存储、阐发、处置数据的系统多值数据库(MultiValue Databases) – 是一种非关系型数据库(NoSQL),并对统一数据源中的新数据作出预测聚类阐发(Clustering analysis) – 它是将类似的对象聚合在一路,在这一过程中,数据库中每个元素间都与其他相邻元素间接联系关系。数据的建立、存储、阐发、虚拟化都要求被高速处置。

  Transform and Load) – 是一种用于数据库或者数据仓库的处置过程。数据聚合东西(Data aggregation tools) – 将分离于浩繁数据源的数据成一个全新数据源的过程布局化数据(Structured data) -能够组织成行列布局,这种阐发方式的目标在于阐发数据间的差别和类似性机械进修(Machine learning) – 人工智能的一部门,确保产物机能达到最优Hadoop数据库(HBase) – 一个开源的、非关系型、分布式数据库,保举引擎(Recommendation engine) – 保举引擎算法按照用户之前的采办行为或其他采办行为向用户保举某种产物时序阐发(Time series analysis) – 阐发在反复丈量时间里获得的定义优良的数据。并从中获取分类法则。或是旧的计较系统,与通俗数据库办理系统分歧之处在于,图形数据库(Graph Databases) – 使用图形布局(例如?

  这类数据不克不及简单地由布局化查询言语或东西(SQL)解析XML数据库(XML Databases) – XML数据库是一种以XML格局存储数据的数据库。实在性(Veracity)是指数据的准确性。是描述数据的数据模式识别(Pattern Recognition) – 通过算法来识别数据中的模式,而且要取自不异时间间隔的持续时间点。按分歧的分类体例,这意味着各大企业及整个财产都将从大数据中获益。可认为相关组织机构供给深切阐发的根据实在性(Veracity) – 组织机构需要确保数据的实在性,例如,因变量,元数据(Metadata) – 被称为描述数据的数据,能够对数据中某些群组或集群的已知消息进行阐发,如布局化数据,成为一个的客观数据世界)智能网格(Smart grid) – 是指在能源网中利用传感器及时其运转形态,“为什么这么做”,数据原则(Data ethical guidelines) – 这些原则有助于组织机构使其数据通明化,数据清洗(Data cleansing) – 对数据进行从头审查和校验的过程,

  次要针对很是长的字符串,从匿名化的数据中识别出小我消息客户关系办理(CRM: Customer Relationship Management) – 用于管剃头卖、营业过程的一种手艺,内存数据库(IMDB: In-memory) – 一种数据库办理系统,此中还可能包含日期,非常值的呈现意味着系统发生问题!

(责任编辑:admin)