python学习笔记："爬虫+有道词典"实现一个简单的英译汉程序

本文转载自查看原文 2015-05-04 00:17 8953 爬虫/ python/ 翻译/ Python && Theano

1.有道的翻译

网页： www.youdao.com

Fig1

Fig2

Fig3

Fig4

再次点击"自动翻译"->选中'Network'->选中'第一项'，如下：

Fig5

然后显示出如下内容，红框画出的部分是等会编写代码需要的地方：

Fig6

Fig7

再看看翻译的结果：

Fig8

2.python实现英译汉：

原理：把需要翻译的内容输入给有道词典，然后通过程序把翻译的结果爬下来。

 1 # -*- coding:utf-8 -*- 
 2 """
 3 Created on Sun May 03 09:36:12 2015  4 
 5 @author: 90Zeng  6 """
 7 
 8 import urllib  9 import json 10 
11 # 注意这里用unicode编码，否则会显示乱码
12 content = input(u"请输入要翻译的内容：") 13 # 网址是Fig6中的 Response URL
14 url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/'
15 # 爬下来的数据 data格式是Fig7中的 Form Data
16 data = {} 17 data['type'] = 'AUTO'
18 data['i'] = content 19 data['doctype'] = 'json'
20 data['xmlVersion'] = '1.6'
21 data['keyfrom'] = 'fanyi.web'
22 data['ue'] = 'UTF-8'
23 data['typoResult'] = 'true'
24 
25 # 数据编码
26 data = urllib.urlencode(data) 27 
28 # 按照data的格式从url爬内容
29 response = urllib.urlopen(url, data) 30 # 将爬到的内容读出到变量字符串html，
31 html = response.read() 32 # 将字符串转换成Fig8所示的字典形式
33 target = json.loads(html) 34 # 根据Fig8的格式，取出最终的翻译结果
35 result = target["translateResult"][0][0]['tgt'] 36 
37 # 这里用unicode显示中文，避免乱码
38 print(u"翻译结果：%s" % (target["translateResult"][0][0]['tgt']))

运行：

学习资料来源：小甲鱼的视频‘零基础入门python’

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 cef3和duilib简单仿有道词典学习 Python爬取有道词典有道词典的翻译接口调用有道词典翻译api 破解有道词典语音库 ubantu 16.04 安装有道词典网易有道词典去广告版 Ubuntu菜鸟入门（六）—— 有道词典安装 Python实现 Typora数学公式转有道云笔记Markdown数学公式使用DotNetOpenAuth来实现有道云笔记的授权