- Rvest 包中常用函數一覽:
函數 | 作用 |
---|---|
read_html() |
讀取 html 頁面 |
html_nodes() |
提取所有符合條件的節點 |
html_node() |
返回一個變量長度相等的list,相當於對html_nodes() 取[[1]] 操作 |
html_table() |
獲取 table 標簽中的表格,默認參數trim=T ,設置header=T 可以包含表頭,返回數據框 |
html_text() |
提取標簽包含的文本,令參數trim=T ,可以去除首尾的空格 |
html_attrs(nodes) |
提取指定節點所有屬性及其對應的屬性值,返回list |
html_attr(nodes,attr) |
提取節點某個屬性的屬性值 |
html_children() |
提取某個節點的孩子節點 |
html_session() |
創建會話 |