




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
——Hadoop集群(第10期)精华集锦csAxp虾皮工作室ogscomxiapi河北工业大学——软件工程与理论实验室编辑:虾皮1Hadoop集群(第10期)MySQL库s1)准备软件2)安装环境:3)开始安装河北工业大学——软件工程与理论实验室编辑:虾皮2定制安装:安装允许你完全控制你想要安装的软件包和安装路径。包包括的组件包括。m河北工业大学——软件工程与理论实验室编辑:虾皮3下先前的设置,如果有误,按“Back”返回重做。按“Install”开始安河北工业大学——软件工程与理论实验室编辑:虾皮4第六步:正在安装中,请稍候……t河北工业大学——软件工程与理论实验室编辑:虾皮5MySQLConfigurationWizard(配置向导)可以帮助自动配置Windows中的服务器。MySQLConfigurationWizard(配置向导)问你一系列问题,然后将回答放到模板中生成一河北工业大学——软件工程与理论实验室编辑:虾皮6和StandardConfiguration(标准配置)。StandardConfiguration(标准配置)选项适合想要快 ConfigurationWizard(配置向导)自动设置所有配置选项,但不包括服务选项和安全选项。StandardConfiguration(标准配置)设置选项可能与安装MySQL的系统不兼容。如果第十一步:选择服务器类型,可以选择3种服务器类型,选择哪种服务器将影响到MySQLConfigurationWizard(配置向导)对内存、硬盘和过程或使用的决策。DeveloperMachine(开发机器):该选项代表典型个人用桌面工作站。假定机器上QLQLDedicatedMySQLServerMachine(专用MySQL服务器):该选项代表只运行河北工业大学——软件工程与理论实验室编辑:虾皮7MySQL否使用InnoDB储存引擎,lyMyISAMxt河北工业大学——软件工程与理论实验室编辑:虾皮8L河北工业大学——软件工程与理论实验室编辑:虾皮9第十五步:进行网络配置,在NetworkingOptions(网络选项)对话框中可以启用或禁L河北工业大学——软件工程与理论实验室编辑:虾皮10MySQLWindows般选择设成服务,这样以后l河北工业大学——软件工程与理论实验室编辑:虾皮11“Enablerootaccessfromremotemachines(是否允许root用户在其它的机器上登,就勾上它)”。CreateAnAnonymousAccount(新建一个匿名用户,匿名用户可以连接数据库,河北工业大学——软件工程与理论实验室编辑:虾皮12ySQL4)验证成功p河北工业大学——软件工程与理论实验室编辑:虾皮131)准备软件2)安装环境:3)检查安装rpm-qamysqlli。rm-rf/var/lib/mysql*rm-rf/usr/share/mysql*另一种善后处理:卸载后/var/lib/mysql中的/etc/f会重命名为f.rpmsave,河北工业大学——软件工程与理论实验室编辑:虾皮144)开始安装第一步:上传所需软件。通过“FlashFXP”软件使用“vsftpd”上传用到的两个软件到“/home/hadoop”目录下。m河北工业大学——软件工程与理论实验室编辑:虾皮15netstat-nat并没有与“3306”有关的信息,说明“MySQL服务器”没有启动。通过rvicemysqlstart从上图中已经发现我们的MySQL服务器已经起来了。irpm个目录,它的数据库文件、配置文件和命令文件分别在不同的目录,了解这些目录非常重河北工业大学——软件工程与理论实验室编辑:虾皮16要,尤其对于Linux的初学者,因为Linux本身的目录结构就比较复杂,如果搞不清楚/var/lib/mysql/usrsharemysqlmysqlserver置文件)usr/bin(mysqladminmysqldump等命令)etcrcdinitdmysqlstart/restart/stop/status数据库目录配置文件相关命令河北工业大学——软件工程与理论实验室编辑:虾皮17启动脚本认的数据文件存储目录为/“var/lib/mysql”,所以我们要把目录移到“/”根目录下的“/”根目录下建立“mysql_data”目录dmkdirmysql_data把MySQL服务进程停掉rvicemysqlstop河北工业大学——软件工程与理论实验室编辑:虾皮18mysqladmin-uroot-pshutdown把“/var/lib/mysql”整个目录移到“/mysql_data”mv/var/lib/mysql/mysql_data找到f配置文件cp/usr/share/mysql/f/etc/f查看“/etc/”下面是否有“f”文件,发现没有,然后通过上面的命令河北工业大学——软件工程与理论实验室编辑:虾皮19mcnfRHELumcnf编辑MySQL的配置文件“/etc/f”vim/etc/f【client】socket=/mysql_data/mysql/mysql.sockdefault-character-set=utf8【mysqld】irmysqldata/mysql/mysql.sockysqldatamysql河北工业大学——软件工程与理论实验室编辑:虾皮20ctersetserverutf修改MySQL启动脚本“/etc/rc.d/init.d/mysql”vim/etc/rc.d/init.d/mysql重新启动MySQL服务河北工业大学——软件工程与理论实验室编辑:虾皮21rvicemysqlstartx很关键。河北工业大学——软件工程与理论实验室编辑:虾皮22修改登录密码mysqladmin-urootpassword'new-password'mysqladminu户名-p旧密码password新密码mysqladmin–urootpasswordhadoop测试是否修改成功(1)不用密码登录(2)用修改后的密码登录从上图中得知,我们已经成功修改了密码,并且用新的密码登录了MySQL服务器。防火墙stateNEWmtcpptcpsportjACCEPTstateNEWmtcpptcpdportjACCEPT河北工业大学——软件工程与理论实验室编辑:虾皮23serviceiptablesrestart防火墙erviceiptablesstopchkconfigiptablesoff河北工业大学——软件工程与理论实验室编辑:虾皮24root行的,但是当我们切换至普通用户登录MySQL以MySQL用户“root”用密码形式登录。mysql-uroot-p删除空用户,强烈建议。mysqldeletefrommysql.userwhereuser='';刷新权限表,以便可以使更改立即生效。mysqlflushprivileges;mysqlexit再重新以“mysql”登录测试sqlysqlurootp河北工业大学——软件工程与理论实验室编辑:虾皮25MapReduceMapReduce不区进行了很多努力。一方面,他们设计了类似于关系数据中结构化数据表的技术(Googlee河北工业大学——软件工程与理论实验室编辑:虾皮26MapReduce序分别是DBInputFormat和ts分原则,利用SQL中的LIMIT和OFFSET进行切分获得数据集的范围,请参考DBInputFormatpublicInputSplitgetSplitsJobConfjobintchunksthrowsIOException1)建立关系数据库连接DBConfiguration库配置和创建连接的接口。publicstaticvoidconfigureDBJobjobStringdriverClassStringdbUrlStringuserNameStringPassword)2)相应的从关系数据库查询和读取数据的接口DBInputFormat据库读取数据的格式。DBRecordReader数据记录的接口。3)相应的向关系数据库直接输出结果的编程接口DBOutputFormat据库输出数据的格式。DBRecordWrite据记录的接口。MapReduce序向关系数据库写入数据的操作。为了publicstaticvoidsetOutputJobjobStringtableNameString...fieldName)2.1从数据库中输入数据MapReduce中查询和读取关系数据库可能会大大增加数据库库联机数据分析大量数据的读取处理。读取大量数据记录一个更好的解决办法是:用数据库中的Dump工具将大量待分析数1)首先创建要读入的数据Windows环境河北工业大学——软件工程与理论实验室编辑:虾皮27createdatabaseschool;useschool;urcedstudentsqlolstudentultvarchardefaultNULLarchardefaultNULLintdefaultNULL河北工业大学——软件工程与理论实验室编辑:虾皮28Server河北工业大学——软件工程与理论实验室编辑:虾皮29tport=3306ltcharactersetgbkThedefaultcharactersetthatwillbeusedwhenanewschemaortableiscreatedandnocharactersetisdefinedersetserverutfLinux环境河北工业大学——软件工程与理论实验室编辑:虾皮30school,并导入“student.sql”语句。河北工业大学——软件工程与理论实验室编辑:虾皮31到此为止在“Windows”和“Linux”两种环境下面都创建了表“student”表,并初始2)使MySQL能远程连接用MySQL用户“root”登录。mysql-uroot-p使用下面语句进行授权,赋予任何主机访问数据的权限。TOrootIDENTIFIEDBYhadoopWITHGRANTOPTION刷新,使之立即生效。USHPRIVILEGES河北工业大学——软件工程与理论实验室编辑:虾皮32WinMySQL大家还应该记得前面在SQL执行顺序:控制面板>管理工具>高级安全的Windows防火墙>入站规则然后新建规则>选择‘端口’>在‘特定本地端口’上输入一个‘3306’>选择‘允3)对JDBC的Jar包处理(1)在每个节点下的${HADOOP_HOME}/lib下添加该包,重启集群,一般是比较原(2)在Hadoop集群的分布式文件系统中创建“/lib”文件夹,并把我们的的JDBC的这个jar包。因为这个jar包放在了HDFS上,而不是本地系统,这个要理解清楚。河北工业大学——软件工程与理论实验室编辑:虾皮33我们这里采用了第二种方式。4)源程序代码如下所示hebutmrIOExceptionDataInputDataOutputlConnectionlDriverManagerqlPreparedStatementlResultSetlSQLExceptiongapachehadoopfilecacheDistributedCacheapachehadoopfsPathgapachehadoopioLongWritableapachehadoopioTextrgapachehadoopioWritablegapachehadoopmapredJobClientapachehadoopmapredJobConfapachehadoopmapredMapReduceBaseapachehadoopmapredMappergapachehadoopmapredOutputCollectorapachehadoopmapredFileOutputFormatgapachehadoopmapredReporterrgapachehadoopmapredlibIdentityReducerrgapachehadoopmapredlibdbDBWritableorgapachehadoopmapredlibdbDBInputFormatrgapachehadoopmapredlibdbDBConfigurationpublicclassReadDB{icclassMapextendsMapReduceBaseimplements河北工业大学——软件工程与理论实验室编辑:虾皮34Mapper<LongWritable,StudentRecord,LongWritable,Text>{idmapLongWritablekeyStudentRecordvaluectorReporterreporterthrowsIOException{llectnewLongWritablevalueidtvaluetoString}}aticclassStudentRecordimplementsWritableDBWritableameexverridepublicvoidreadFields(DataInputin)throwsIOException{thisidinreadInt;thisnameTextreadStringin;thissexTextreadStringin;thisageinreadInt;}verridepublicvoidwrite(DataOutputout)throwsIOException{iteIntthisidtwriteStringoutthisnametwriteStringoutthissexiteIntthisage}verrideoidreadFieldsResultSetresultthrowsSQLExceptionthisidresultgetInt);thisnameresultgetString2);thissexresultgetString3);thisageresultgetInt);}verridepublicvoidwrite(PreparedStatementstmt)throwsSQLException{河北工业大学——软件工程与理论实验室编辑:虾皮35isidgthisnamegthissexisage}verridepublicStringtoString(){}}publicstaticvoidmain(String[]args)throwsException{fnewJobConfReadDBclassconfsetmapredjobtracker",":9001");butedCacheaddFileToClassPathnewPathFormatDBInputFormatclassKeyClassLongWritableclassalueClassTextclassrClassMapclassrClassIdentityReducerclassormatsetOutputPathconfnewPathrdboutonfigurationconfigureDBconfcommysqljdbcDriverjdbcmysqlschoolroot,"hadoop");String]fields={"id","name","sex","age"};河北工业大学——软件工程与理论实验室编辑:虾皮36onf}}5)运行结果如下所示WinLinuxMySQL,执行结果都一样。唯独变得就是代码中“DBConfiguration.configureDB”中MySQL数据库所在机器2.2向数据库中输出数据基于数据仓库的数据分析和挖掘输出结果的数据量一般不会太大,因而可能适合于直1)创建写入的数据库表useschool;sourcesql全路径oolwordcount河北工业大学——软件工程与理论实验室编辑:虾皮37mentvarchardefaultNULLfaultNULLWindows环境Linux环境2)程序源代码如下所示hebutmrIOExceptionDataInputDataOutput河北工业大学——软件工程与理论实验室编辑:虾皮38qlPreparedStatementlResultSetlSQLExceptionilIteratortilStringTokenizergapachehadoopfilecacheDistributedCacheapachehadoopfsPathapachehadoopioIntWritableapachehadoopioTextpachehadoopioWritablegapachehadoopmapredFileInputFormatgapachehadoopmapredJobClientapachehadoopmapredJobConfapachehadoopmapredMapReduceBaseapachehadoopmapredMappergapachehadoopmapredOutputCollectorapachehadoopmapredReducergapachehadoopmapredReportergapachehadoopmapredTextInputFormatorgapachehadoopmapredlibdbDBOutputFormatrgapachehadoopmapredlibdbDBWritablergapachehadoopmapredlibdbDBConfigurationpublicclassWriteDB{icclassMapextendsMapReduceBaseimplementsMapper<Object,Text,Text,IntWritable>{vatefinalstaticIntWritableonenewIntWritableteTextwordnewTextverrideidmapObjectkeyTextvalueOutputCollectorTextIntWritableoutputReporterreporter)throwsIOException{inglinevaluetoStringngTokenizertokenizernewStringTokenizerlinewhile(tokenizer.hasMoreTokens()){wordsettokenizernextToken());tcollectwordone}}}河北工业大学——软件工程与理论实验室编辑:虾皮39icclassCombineextendsMapReduceBaseimplementsReducerTextIntWritable,Text,IntWritable>{verridevoidreduceTextkeyIteratorIntWritablevaluesOutputCollectorTextIntWritableoutputReporterreporter)throwsIOException{mwhile(values.hasNext()){nextget}utputcollectkeynewIntWritablesum}}icclassReduceextendsMapReduceBaseimplementsReducerTextIntWritable,WordRecord,Text>{verridevoidreduceTextkeyIteratorIntWritablevaluesthrowsIOException{mwhile(values.hasNext()){nextget}WordRecordwordcountnewWordRecord);wordcountwordkey.toString();wordcountnumbersumrcollectwordcountnewText}}publicstaticclassWordRecordimplementsWritable,DBWritable{orderverride河北工业大学——软件工程与理论实验室编辑:虾皮40idreadFieldsDataInputinthrowsIOExceptionthiswordTextreadStringin;thisnumberinreadInt;}verridepublicvoidwrite(DataOutputout)throwsIOException{twriteStringoutthiswordteIntthisnumber}verrideoidreadFieldsResultSetresultthrowsSQLExceptionthiswordresultgetString1);thisnumberresultgetInt2);}verridepublicvoidwrite(PreparedStatementstmt)throwsSQLException{gthiswordisnumber}}publicstaticvoidmain(String[]args)throwsException{newJobConfWriteDBclassconfsetmapredjobtracker",":9001");butedCacheaddFileToClassPathnewPathormatTextInputFormatclassFormatDBOutputFormatclass这两句,通不过,但是网上给的例子没有这两句。KeyClassTextclassValueClassIntWritableclassrClassMapclasserClassCombineclass河北工业大学——软件工程与理论实验室编辑:虾皮41rClassReduceclassrmatsetInputPathsconfnewPathwdbinonfigurationconfigureDBconfcommysqljdbcDriverjdbcmysqlschoolroot"hadoop");Stringfieldswordnumber"};OutputFormatsetOutputconfwordcountfieldsonf}}3)运行结果如下所示Windows环境(1)file1.txthellowordhellohadoop(2)file2.txtp河北工业大学——软件工程与理论实验室
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 单位采购合同标准文本标准文本
- 借款合同标准文本wps
- 2025办公文具采购合同(合同版本)
- 单位定水果合同范本
- 光伏电站除草服务合同范例
- 交房活动合同范例
- 共用场地合同标准文本
- 单位周边租房合同范例
- 关于旅游类合同标准文本
- 卖房 标准合同范例
- JGJ-T12-2019轻骨料混凝土应用技术标准
- 山东省济宁市2022-2023学年高一7月期末生物试题(原卷版)
- 2024社工初级考试题库及参考答案1套
- 部编五年级下册语文一、二单元试卷
- 民航专业工程施工监理规范
- 初中英语七选五经典5篇(附带答案)
- (正式版)YST 1693-2024 铜冶炼企业节能诊断技术规范
- 2024年福建广电网络集团有限公司招聘笔试参考题库附带答案详解
- 三级医院评审标准(2022 年版)广东省实施细则院感组
- 医疗器械冷链(运输、贮存)管理指南
- 03s402国家标准图集
评论
0/150
提交评论