目录
Outscraper 谷歌地图数据搜刮器
谷歌地图数据抓取工具 是Outscraper服务中最受欢迎的搜刮工具之一。在Outscraper上,每天都有数以百计的谷歌地图搜刮任务被创建。
参数和过滤器应正确设置,以避免结果中出现不相关的数据。我们建议所有客户先阅读我们关于谷歌地图数据抓取的主要教程。它是"如何搜刮谷歌地图?"
在基本参数设置正确后,应根据预期添加一些过滤器。你可以用你的基本参数创建一个小的测试任务来审查你的结果。过滤器可以缩小结果文件的范围。下面描述的过滤器可能对你有用。
为什么以及何时需要为谷歌地图数据搜刮服务使用过滤器?
谷歌地图服务在结果列表中显示接近或类似于搜索的类别/关键词的结果,这是因为它希望为用户提供方便和有用的用户体验。
例如,你想在洛杉矶找到 "韩国杂货店",你在谷歌地图上搜索 "美国加州洛杉矶附近的韩国杂货店"。
当你滚动浏览结果时,谷歌地图还向你显示了亚洲杂货店和日本杂货店的结果,它认为这可能与韩国杂货店有关。
这种情况会不可避免地改变你想要达到的结果。因为Outscraper谷歌地图数据搜刮器是一项服务,可以搜刮谷歌地图对搜索查询所显示的结果。
由于谷歌地图在这个查询结果中显示了日本杂货店和亚洲杂货店,这些结果也将出现在搜刮任务结果文件中。你使用这样的参数在Outscraper谷歌地图数据搜刮器中进行 "韩国杂货店 "类别/关键词的搜索。
当你用这些参数进行直接搜索时,结果将显示如下。
在没有任何过滤器的情况下刮取任务结果。 韩国杂货店
正如你所看到的,在搜刮任务结果中得到了类似的结果,就像在谷歌地图网页中一样。这个搜索包含218个结果,包括混合杂货店类型。但你只想搜刮韩国杂货店的结果。你将如何做到这一点?你应该为此查看 "高级过滤器"。
通过使用子类型的高级过滤器,我们可以用同样的参数得到想要的结果。
通过这个过滤器,我们得到了在其子类型中特别有一个韩国杂货店的结果。因此,所有在子类型中被定义为亚洲杂货店或日本杂货店但没有韩国杂货店的结果都被剔除。
用子类型过滤器刮取任务结果。 带有子类型过滤器的韩国杂货店
只搜刮完全匹配的类别
谷歌地图数据搜刮服务中的 "只搜刮完全匹配的类别 "选项框是一个让用户进行简单过滤的功能。当你点击 "只搜刮完全匹配的类别 "选项框时,Outscraper将快速生成一个子类型过滤器,如上面的例子所示。
这里要注意的最重要一点是,这个功能只适用于 "英语 "语言。对于其他语言,需要手动过滤。
如果你需要简单的过滤,就像上面的例子一样,"只搜刮完全匹配的类别 "选项框对你来说就足够了。如果你需要做不同的和更详细的过滤,你将需要更仔细地看一下高级过滤器。
如何使用高级过滤器?
语言和使用正确的类别
你有机会用谷歌地图进行各种语言的搜索。同样地,你也可以通过Outscraper搜索这些语言。如果你要使用一个在德语中使用的类别,你应该从这里的列表中选择德语。
在Outscraper中,有一个普遍使用的英语类别列表。你可以在这里找到它。
谷歌地图业务类别
本列表中的类别的字面翻译在其他语言中可能并不总是准确的。出于这个原因,可能需要做一点初步工作,以找到正确的类别术语。
除了翻译之外,你要搜索的关键词/类别在谷歌地图上可能有不同的定义。在不创建大型任务的情况下进行初步准备是很有利的。
假设你搜索 "fruiser "这个词,作为一个类别,它在德语中是指理发师。
作为搜索的结果,谷歌地图将向你显示为这个词定义的类别。它是friseursalon。用这个定义的类别(friseursalon)创建一个任务将给你带来完整和正确的结果。
当类别被确定为所需的语言时,在开始任务之前,有一个非常重要的设置必须进行。就是在高级参数语言部分选择正确的语言。
在正确设置语言和类别后,你可以查看过滤器部分。
过滤器
通过将子类型、类型、城市、邮政编码、州、站点、电话等级、商业状态和已验证的字段与 "包含其中一个"、"不包含其中一个"、"始于"、"等于"、"为空 "和 "不为空 "运算符结合起来,可以进行不同种类的过滤。
你可以看到在子类型和类型标题中 "包含一个 "运算符的使用,在网站标题中 "不包含 "运算符的使用,在评级标题中 "以 "运算符开始,以及在电话标题中 "不是空白 "运算符的使用。
子类型
在谷歌地图上注册的每个企业都由一个类别和类型以及多个子类型来定义。
用这些参数做的任务的结果就是这样出来的。
从结果中可以看出,有些企业有许多子类型,如 "Fußpflege, Nagelstudio, Damen- und Herrenfriseur "以及 "Friseursalon "子类型。你可以使用这些子类型来提取你的目标企业。
让我们来区分这些为男性和女性提供服务的理发店。子类型 "Damen- und Herrenfriseur "表达了这一点。Damen- und Herrenfriseur "的翻译是女士和男士理发店。
为了做到这一点,需要在现有的子类型过滤器上增加另一个子类型过滤器。参数将以这种方式确定。
网站
网站过滤器提供了一个机会,在搜刮谷歌地图的同时,通过它们是否有网站来过滤企业。因此,有可能只列出没有网站的企业。
这个过滤器有两个选项。"不是空白 "和 "是空白"。当选择 "是空白 "操作时,只有非网站的企业会被列入结果文件中。而选择 "非空白 "则相反,只有有网站的企业才会被列入结果文件中。
查询。 暖通空调承包商, 美国加利福尼亚州洛杉矶市, 美国
就像例子中的查询一样,有些企业在其谷歌地图资料中设有网站;有些则没有。有了这个过滤器,就有可能把这些企业分开。
通过这些参数,我们将创建一个任务,只提取没有网站的企业。
从任务结果文件中可以看出,所有没有网站的企业都被列出。如果选择了 "不是空白 "的操作符,这个名单上的所有企业将被淘汰,而所有其他有网站的企业将被列出。
评价
当它想只搜刮具有某些评级的Google Places时,就会使用 "评级 "过滤器。
查询。餐馆, 圣巴巴拉, CA, 美国
https://www.google.com/maps/search/restaurant%2C+Santa+Barbara%2C+CA%2C+United+States/?hl=en&gl=US
这个查询结果中的餐馆有各种评分。你可能想搜刮只有3个评级的餐馆。因此,你可以使用一个评级过滤器,而不是搜刮所有的餐馆并手动清理其余的餐馆。这样,你就节省了时间和金钱。
应打开 "高级参数 "菜单,通过点击 "添加过滤器 "选择评级字段。
这里,选择了 "始于 "运算符。因为在这些餐馆中,有一些地方的评分是3、3.1和3.6。因此,它涵盖了它们全部。如果选择 "包含其中之一 "运算符,并将3作为数值输入,那么评级为4.3的餐厅也会出现在结果中。
选择过滤器后,可以直接创建任务。
当用这些参数创建任务时,任何没有电话号码的业务将不包括在结果文件中。
业务状况
你可以在谷歌地图上看到,一些公司暂时关闭。
这些业务的状态出现在结果文件的business_status栏中。
如果你只想搜刮处于 "运营 "状态的企业,只需使用 "包含其中之一 "操作符。
已验证
有些企业可能没有验证他们的谷歌企业注册。你可以在谷歌地图上看到这种情况,上面写着 "声称此企业"。
这些企业的状态显示在Outscraper谷歌地图数据搜刮器结果文件中的 "已验证 "栏。
如果你请求的结果文件只需要验证业务,那么使用 "已验证 "字段过滤器和 "包含其中之一 "操作符就足够了。
相反,如果你想看到未经验证的企业,只需输入 "FALSE "作为数值。
常见问题
最常见的问题和答案
你可以在Outscraper Google Maps Scraper应用仪表板上为你的搜刮任务创建不同种类的过滤器。
你可以在谷歌地图上轻松找到某个细分类别的所有企业。只要使用 "子类型 "过滤器来缩小和细化你的搜刮结果文件。
Outscraper Google Maps Scraper的网站过滤器让你可以找到没有网站的公司。在字段中选择 "网站 "过滤器,并将操作者设置为 "是空白"。Outscraper将为你找到所有没有网站的公司。
邮政编码可以用来过滤谷歌地图的搜刮结果文件。只要确定邮政编码的正确格式,并在仪表板上添加 "postal_code "过滤器。
Outscraper Google Maps Data Scraper有 "business_status "过滤器,可以根据公司的经营状况找到它们。你可以定义过滤器的值为。
业务
暂时关闭_暂时关闭
永久关闭
0 评论