- Rvest 包中常用函數一覽:
| 函數 | 作用 |
|---|---|
read_html() |
讀取 html 頁面 |
html_nodes() |
提取所有符合條件的節點 |
html_node() |
返回一個變量長度相等的list,相當於對html_nodes()取[[1]]操作 |
html_table() |
獲取 table 標簽中的表格,默認參數trim=T,設置header=T可以包含表頭,返回數據框 |
html_text() |
提取標簽包含的文本,令參數trim=T,可以去除首尾的空格 |
html_attrs(nodes) |
提取指定節點所有屬性及其對應的屬性值,返回list |
html_attr(nodes,attr) |
提取節點某個屬性的屬性值 |
html_children() |
提取某個節點的孩子節點 |
html_session() |
創建會話 |
