如何在 R 和 Python 中翻译网页抓取_第1页
如何在 R 和 Python 中翻译网页抓取_第2页
如何在 R 和 Python 中翻译网页抓取_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设您需要在用R和Python翻译网页后从网站上抓取数据。在谷歌浏览器中,有一个选项(或功能)可以翻译任何外语。如果您是英语使用者并且不懂任何其他外语,并且您想要从没有将语言转换为英语的选项的网站中提取数据,那么本文将帮助您如何执行网页翻译。什么是硒?您可能不熟悉Selenium,因此了解背景非常重要。Selenium是一个开源工具,在测试领域非常流行,用于自动化Web浏览器。它允许您用多种编程语言编写测试脚本。Selenium在R和Python中均可用。在R和Python中翻译网页抓取在R中有一个名为RSelenium的包,而在Python中可以通过安装selenium包来安装Selenium。以下是Chrome支持的语言及其代码列表。您需要此代码来使Chrome理解您想要将网页从哪种语言翻译成哪种语言。姓名代码阿姆哈拉语am阿拉伯ar巴斯克eu孟加拉bn英语(英国)en-GB葡萄牙语(巴西)pt-BR保加利亚语bg加泰罗尼亚语ca切罗基chr克罗地亚语hr捷克语cs丹麦语da荷兰语nl英语(美国)en爱沙尼亚语et菲律宾人fil芬兰fi法语fr德语de希腊语el古吉拉特语gu希伯来语iw印地语hi匈牙利hu冰岛的is印度尼西亚id意大利语it日本人ja卡纳达语kn韩国人

ko拉脱维亚语lv立陶宛语lt马来语ms马拉雅拉姆语ml马拉地语mr挪威no抛光pl葡萄牙语(葡萄牙)pt-PT罗马尼亚语ro俄语ru塞尔维亚sr中文(中华人民共和国)zh-CN斯洛伐克语sk斯洛文尼亚语sl西班牙语es斯瓦希里语SW瑞典SV泰米尔语ta泰卢固语te泰国th中文(台湾)zh-TW土耳其tr乌尔都语ur乌克兰uk越南语vi威尔士语cy我们主要使用以下语法执行3个操作。首先,我们加载selenium并指定翻译语言。然后我们在Chrome中打开一个空白页面并导航到我们要从中提取数据的URL。就是这里.ru/events/。最后我们拍摄网页快照。R代码PYTHON代码在运行下面的代码之前,

您需要先安装Docker。转到产品并下载下载DockerDesktop并安装后,请按照以下代码操作。library(RSelenium)shell('dockerrun-d-p4445:4444selenium/standalone-chrome')eCaps<-list(chromeOptions=list(args=c('--disable-gpu','--window-size=1920,1080','--lang=en'),prefs=list(translate_whitelists=list('ru'='en'),translate=list('enabled'='true'))))remDr<-RSelenium::remoteDriver(remoteServerAddr="localhost",port=4445L,browserName="chrome",extraCapabilities=eCaps)remDr$open(silent=TRUE)remDr$navigate(".ru/events/")remDr$screenshot(dis

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论