举个小栗子。
输入以下公式,将单元格A2 中的值翻译为英汉或汉英翻译。
=FILTERXML(WEBSERVICE(‘http://fanyi.youdao.com/translate?i=’A2’doctype=xml’),’//翻译’)
公式看起来很长,主要是因为URL长度太长。事实上,公式的结构非常简单。
主要由3部分组成:
第1 部分构建URL。
‘http://fanyi.youdao.com/translate?i=’A2’doctype=xml’

这是有道在线翻译的网址,里面有关键参数。 i=’A2为需要翻译的词汇,doctype=xml为返回文件的类型,为xml。之所以返回xml是因为FILTERXML函数可以获取XML结构化内容中的信息。
第2 部分读取URL。
WEBSERVICE通过指定的网页地址从Web服务器获取数据(需要计算机联网状态)。
在本例中,B2公式为:
=WEBSERVICE(‘http://fanyi.youdao.com/translate?i=’A2’doctype=xmlversion’)
获取数据如下:
?xml 版本=’1.0’编码=’UTF-8’?

响应类型=’ZH_CN2EN’errorCode=’0′ elapsedTime=’1′
输入
![CDATA[幸福]]
/输入
翻译
![CDATA[幸福]]
/翻译

/回复
第3 部分获取目标数据。
这里使用了FILTERXML函数。 FILTERXML 函数语法为:
FILTERXML(xml,xpath)
有两个参数。 xml参数为有效的xml格式文本,xpath参数为要查询的目标数据在xml中的标准路径。
通过第2部分获取的xml文件内容,我们可以直接看到happy的翻译结果在翻译路径下(粉色标记),所以第二个参数设置为“//translation”。
用户评论
话扎心
当然可以,Python的requests和BeautifulSoup库就非常适合用来抓取网页数据。
有20位网友表示赞同!
毒舌妖后
你好,使用函数抓取网页数据是个不错的想法,但我对编程不太熟悉,能详细点吗?
有10位网友表示赞同!
三年约
可以使用函数抓取网页数据?听起来很高级啊,但我担心会破坏网站。
有7位网友表示赞同!
南宫沐风
你好,请问抓取网页数据需要用到哪些编程语言和工具呢?
有12位网友表示赞同!
北染陌人
使用函数抓取网页数据很方便,但我更关心数据的安全性。
有9位网友表示赞同!
半世晨晓。
你好,我正在学习抓取网页数据,请问有哪些推荐的书籍或教程?
有17位网友表示赞同!
月下独酌
抓取网页数据时,要注意遵守网站的robots.txt规则哦。
有13位网友表示赞同!
闲肆
使用函数抓取网页数据是个好主意,不过得确保不会违反版权问题。
有6位网友表示赞同!
一样剩余
你好,请问抓取网页数据后,如何进行数据清洗和分析呢?
有20位网友表示赞同!
隔壁阿不都
使用函数抓取网页数据是个挑战,但也是一种很有趣的学习过程。
有18位网友表示赞同!
琴断朱弦
抓取网页数据时,要注意不要过度请求,以免被网站封禁。
有20位网友表示赞同!
别伤我i
你好,我尝试使用函数抓取网页数据,但总是遇到403错误,怎么办?
有17位网友表示赞同!
心安i
使用函数抓取网页数据可以节省很多时间,但也要注意代码的效率和可维护性。
有11位网友表示赞同!
炙年
抓取网页数据是个技术活,不过一旦掌握了方法,感觉超级强大。
有14位网友表示赞同!
情字何解ヘ
你好,请问有推荐的Python库来帮助抓取网页数据吗?
有7位网友表示赞同!
绝版女子
使用函数抓取网页数据需要注意,避免抓取到敏感信息。
有5位网友表示赞同!
未来未必来
抓取网页数据是个好技能,但也要有道德底线,不要滥用。
有6位网友表示赞同!
凝残月
你好,我想学习抓取网页数据,但不知道从哪里开始,有推荐的学习路径吗?
有15位网友表示赞同!