正则表达式提取
仅使用这 3 个公式,您就应该能够抓取和清理任何目的所需的数据 - 无论是微调 Twitter 受众、分析链接还是您能想到的任何其他事情。这些公式的美妙之处在于其多功能性,因此它们的用例几乎是无限的。通过理解其背后的概念,可以根据具体用例改变变量。但是,抓取、清理和呈现数据所需的过程将保持不变。
需要注意的是,抓取有局限性,有些网站(比如谷歌)确实不希望任何人抓取他们的内容。这篇文章纯粹是为了帮助您以比您想象的更快、更轻松的方式提取和组织智能 Moz 阅读器数据。
让我们在 Twitter 上找一些我们应该关注(或定位)的 viber 电话号码数据 有趣的人。这真的很重要吗?。当我在 Twitter 上搜索有关有趣人物的话题时,我发现自己进入了以下页面:
有趣的人 url 2.png
直接复制并粘贴到宾果 Google Doc 中将是一场灾难。页面上还有很多其他内容。这就是 IMPORTXML 的作用所在。
第一步是打开 Google 表格并在单元格中输入所需的 URL。这可以是任何单元格,但在下面的示例中,我将 URL 放在了单元格 A1 中。
导入xml1.png
在开始抓取之前,我们需要弄清楚我们计划抓取什么数据。在这种情况下,它是一个 Twitter 句柄,所以我们就要这样做。
首先,右键单击我们的目标(Twitter 句柄),然后单击“检查元素”。
检查 element.png。
进入“检查元素”后,我们想知道我们的目标位于页面的什么位置。
twitter 检查元素 2.png
頁:
[1]