




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分布式全文搜索引擎Search|2018年11
123412341什么是概一种基于ElasticSearch的分布式全文搜索与分对ElasticSearch进行了多种功能升级和优化,并通过Esdrive实现了SQL的全方位支特分布式实时文 -PB级数据规分布式实时搜索分 分
Search简 什么是特SQL引擎与搜索引擎相融高扩-在TDH平台中,Search扮演两种角作为Hyperbase作为一个独立的服务,既是一个分布式文 系统,又是一个强大的全文搜索引
Search简 文档数据半结构化、非结构化数功能和性能均优于日志分析统计和日志类时间序列数据 和分分高聚合率的统计分搜索引多条件模糊查不指定列的全文搜
Search简 2
Search原Index(索引Search以Index为单位组织数据 ),一个Index中的数据通常具有相似的特与HBase中的索引(全局索引)不是一个概念,这里是指Search的数据对Type(分类Type是Index的逻辑分类,如何分类由用户决定,一个Index可定义一个或多个(文档Search的最基础数据单元,以JSON格-例如:员工的基本信息{"namezhangsan","age":30on_board_data":"2016-10-01",}Field(字段中的数 在Field
Search数据对象与传统二维表的映射关Type是Index的逻辑分类
Search原(文档分基本过-将词转换为标准形式,以提高查全率,如:电脑分词-英文分词器:standard、倒排索假设有两篇文-文档1的内容:TomlivesinShanghai,IliveinShanghai-文档2的内容:Heoncelivedin
Search原
Search原倒排索对文档进行分-文档1的分词结果:[TomliveShanghai]i]live-文档2的分词结果:[helive根据分词结果,构建倒排索词3,1I41[2],2,5,31
Search原SQLAPIAPISQLSQL SQLSQL100TB10服务器节点搜索分析性能(秒全文索引模糊匹 3
FullFullFullFull3 3
Search安装与配
Search安装与配
Search安装与配
Search安装与配
Search安装与配 4RESTEsdriveREST方在命令行中通过curl命 REST端口默认为示任务:搭建一个员工信息Index(Index名为 -Index的Type按部门分类:dev(研发部)、finance(财务部)和sales(销售部第1步:创建名为employee的
Search基本用 /* /*创建Indexemployee,pretty表示以JSONcurl-XPUT{"acknowledged":}/*向/*向Indexemployee的Typedevcurl-XPUT'localhost:9200/employee/dev/1?pretty'-d"firstname":"lastname":"age":"on_board_date":"2015-10-31","hometown":"Beijing","school":"NanjingUniversity","married":false,"about":"IloveBeijing/*式{"_index":"employee",//index"_type":"_id":"_version":"_shards":"total":"successful":"failed":"created":type//Shard}示第2步:编 ,即向Index中新增一条员工信
Search基本用 REST
Search基本用/*/*获取Indexemployee的Typedevcurl-XGET/*返回结果 {"_index":"employee","_type":"dev","_id":"1","_version":1,"found":"_source":"firstname":"San","lastname":"Zhang","age":26,"on_board_date":"2015-10-"hometown":"Beijing","school":"NanjingUniversity","married":false,"about":"IloveBeijing}}示第3步:查 是否存/*/*查看/employee/dev/1下是否存在 ,-i表示打印HTTPheader*/curl-i-XHEAD'localhost:9200/employee/dev/1'第4步:获 REST
Search基本用/*/*中的age改为30curl-XPUT'localhost:9200/employee/dev/1?pretty'-d"firstname":"lastname":"Zhang","age":30,"on_board_date":"2015-10-31","hometown":"Beijing","school":"NanjingUniversity","married":false,"about":"IloveBeijing/*号加1{"_index":"employee",//index"_type":"_id":"_version":"_shards":"total":"successful":"failed":"created":type//Shard}示第5步:更 REST
Search基本用/*/*删除/employee/dev/1curl-XDELETE示第6步:删第7步:删除/*/*删除Indexemployeecurl-XDELETE{"acknowledged":} Esdrive
Search基本用EsdriveEsdrive
Esdrive
Search基本用创建Esdrive内在Search中创建Index,同时在Inceptor中创建对应的映射表(Esdrive内表CREATETABLE<tableName>(<id>STRING,<col_name1><data_type1>,<col_name2><data_type2>,...)STOREDAS[WITHSHARDNUMBER<m>][REPLICATION<n>] Esdrive
Search基本用创建Esdrive内示例:创建了一张名为esdrive_inner_table的Esdrive内表,字段包含所有的数据类型,Shard为10,副本数为1,均采用默认createcreatetableesdrive_inner_table(key1string,sv0int,sv1boolean,sv2tinyint,sv3smallint,sv4sv5float,sv6double,sv7string,sv8date,sv9timestamp)storedas Esdrive
Search基本用创建Esdrive外在Inceptor中创建映射表(Esdrive外表),与已存在的Index建立映射关创建Esdrive外表时,不可指定Shard和副本CREATEEXTERNALTABLE<tableName><id>STRING,<col_name1><data_type1>,<col_name2><data_type2>,)[WITH '='_id,<cl1>,<cl2>,...')] Esdrive
Search基本用创建Esdrive外示CREATECREATEEXTERNALTABLEesdrive_external_tablekey1string,ex0int,ex1bigint,ex2double,ex3)STOREDBYWITHSERDEPROPERTIES('elasticsearch.columns.map TBLPROPERTIES('elasticsearch.tablename'='default.esdrive_inner_table'); 4.2Esdrive
Search基本用分词器 创建Esdrive内表时,直接用SQL-只用于内表中String类型的列,且不可以是内表的首不同语言类型,选择的分词器不/*对中文列指定分词器<col_name>STRING YZER'ZH' ② /*对英文列指定分词器<col_name>STRING YZER'EN' 4.2Esdrive
Search基本用为Esdrive表增加只用于Esdrive内表,不能用于外ALTERALTERTABLE<tableName>ADDCOLUMNS<col_name1><data_type1>,<col_name2><data_type2>,清空Esdrive只能清空Esdrive内表,不能用于外TRUNCATETRUNCATETABLE删除EsdriveLaIeceptorLaIeceptor 4.2Esdrive
Search基本用插入数单条插INSERTINSERTINTOesdrive_inner_table批量插BATCHINSERTBATCHINSERTINTOesdrive_inner_tableBATCHVALUES(VALUES('k2',3,true,3,4,5,6.1,7.33,'dsfx','2010-06-30插入时首列需唯INSERTINTOTABLEesdrive_start(key1,content,INSERTINTOTABLEesdrive_start(key1,content,tint,tbool)VALUES('1', oES',1, INSERTINTOTABLEesdrive_start(key1,content,tint,tbool)VALUES('2',osearch',2, 4.2Esdrive
Search基本用更新数UPDATEUPDATE<tableName>SET<col_name>=<value>WHEREeg:updateesdrive_inner_tablesetsv1=falsewhere删除数DELETEDELETEFROM<tableName>WHEREeg:DELETEFROMesdrive_inner_tableWHERE 4.2Esdrive
Search基本用对于Select语句,EsdriveSQL与InceptorSQL的用法完全相包括Where、GroupBy、Join、集合运算EsdriveSQL检索语义的实第1步:对被查询文本进行分词,生成倒排索第2步:对查询条件进行EsdriveSQL检索语义的优语义更丰查询性能更% 4.2EsdriveContains函通过Contains函数对查询条件进行分
Search基本用<col_name>,)Near操作token1~n:表示检索词(n2),token②③<col_name>,'<col_name>,'NEAR((token1,token2[,token3,...]),slop[,4.2Esdrive
Search基本用Contains函Near操作Select*from yze_zhwherecontains(content,'near((京东,阿里1,7Fuzzy操作①phrase:表示需要查询的短语。先经过分词得到多个token,查询结果必须包含分词后的所有②fuzziness:表示最大编辑距离(Levenshtein距离),用于表达短语之间的语义相似度,中文较复<col_name>,'FUZZY(phrase, 4.2Esdrive
Search基本用selectselectdtfrominceptorwherecontains(hphm,"term'鲁D528E8orderbydtlimitselectdtfrominceptorwherecontains(hphm,"prefix'鲁D528orderbydtlimitselectdtfrominceptorwhereconta
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Unit 6 第三课时 SectionA Grammar focus (3a~3d) 教学设计-2024-2025学年人教版(2024)英语七年级上册
- 高效办公室环境设计与心理调适策略研究报告
- 医疗设备与医疗技术的创新
- 2025四川南充市珙县选聘县属国有企业领导人4人笔试参考题库附带答案详解
- 婚庆行业人才培养与招聘策略
- 2025中国储备粮管理集团有限公司江苏分公司招聘73人笔试参考题库附带答案详解
- 2024重庆重庆长寿投资发展集团有限公司下属子公司招聘7人笔试参考题库附带答案详解
- 2024辽宁沈阳市城市建设投资集团有限公司所属二级企业沈阳公路建设有限公司拟聘用人员笔试参考题库附带答案详解
- 创新型实验室的运营模式探讨
- 预防青少年性侵
- 2023年10月中国互联网发展基金会招考2名工作人员笔试历年典型考题及考点剖析附答案详解
- 2024年甘肃定西中考数学试卷试题真题及答案详解(精校打印)
- 2024年广东省公需课《百县千镇万村高质量发展工程与城乡区域协调发展》考试答案
- 潜伏式AGV驱动电机和减速机选型计算公式说明
- 2024年纪检监察综合业务知识考试题库【综合题】
- 幼小衔接课件科学-认识昆虫模板
- 腋窝入路腔镜甲状腺手术
- 2024年贵州省黔东南州中考英语一模试卷
- 新学位法专题讲座课件
- 小学科学湘科版六年级下册全册同步练习含答案
- (2024年)传染病培训课件
评论
0/150
提交评论