目录

为什么以及何时需要为谷歌地图数据搜刮服务使用过滤器?

谷歌地图服务在结果列表中显示接近或类似于搜索的类别/关键词的结果,这是因为它希望为用户提供一种简单和有用的用户体验。

例如,你想在洛杉矶找到 "韩国杂货店",你在谷歌地图上搜索了 "美国加州洛杉矶附近的韩国杂货店"。

https://www.google.com/maps/search/Korean+grocery+store+near+Los+Angeles,+CA,+USA/@34.0174722,-118.4280778,12z/data=!3m1!4b1!4m2!2m1!6e6

当你滚动浏览结果时,谷歌地图还向你显示了亚洲杂货店和日本杂货店的结果,它认为这些结果可能与韩国杂货店有关。

这种情况会不可避免地改变你想搜刮的结果。因为Outscraper谷歌地图数据搜刮器是一个搜刮谷歌地图对搜索查询所显示的结果的服务。 

由于谷歌地图在这个查询结果中显示了日本杂货店和亚洲杂货店,这些结果也将出现在搜刮任务结果文件中。 你使用这样的参数,在Outscraper谷歌地图数据搜刮器中用 "韩国杂货店 "类别/关键词进行搜索。

当你用这些参数进行直接搜索时,结果将显示如下。

在没有任何过滤器的情况下刮取任务结果。 韩国杂货店

正如你所看到的,在搜刮任务结果中得到了类似的结果,就像在谷歌地图网页中一样。这个搜索包含218个结果,结果包括混合杂货店类型。但是你只想搜刮韩国杂货店的结果。你将如何做到这一点?你应该为此查看 "高级过滤器"。

通过使用子类型高级过滤器,我们可以用同样的参数得到想要的结果。

通过这个过滤器,我们得到了在其子类型中特别有一个韩国杂货店的结果。因此,所有在子类型中被定义为亚洲杂货店或日本杂货店但没有韩国杂货店的结果都被剔除。

用子类型过滤器刮取任务结果。 带有子类型过滤器的韩国杂货店

只搜刮完全匹配的类别

谷歌地图数据搜刮服务中的 "只搜刮完全匹配的类别 "选项框是一个让用户进行简单过滤的功能。当你点击 "只搜刮完全匹配的类别 "选项框时,Outscraper将快速生成一个子类型过滤器,如上例所示。

这里要注意的最重要一点是,这个功能只适用于 "英语 "语言。对于其他语言,需要手动过滤。

如果你需要像上面的例子那样进行简单的过滤,"只搜刮完全匹配的类别 "选项框对你来说就足够了。如果你需要做不同的和详细的过滤,你将需要深入研究高级过滤器。

如何使用高级过滤器?

高级过滤设置可以通过点击 "高级参数(语言、过滤器、每次查询的限制、列等)"文本进入,在这里你可以设置语言、各种字段和运算符。

语言和使用正确的类别

你有机会用谷歌地图搜索世界上的各种语言。同样地,你也可以通过Outscraper用这些语言进行搜索。如果你要使用一个在德语中使用的类别,你应该从这里的列表中选择德语。

在Outscraper中,有一个普遍使用的英语类别列表。你可以在这里找到它。 

谷歌地图业务类别

本列表中的类别的字面翻译在其他语言中可能并不总是准确的。出于这个原因,可能需要做一点初步工作,以找到正确的类别术语。

除了翻译之外,你要搜索的关键词/类别在谷歌地图上可能有不同的定义。在不创建大型任务的情况下进行初步准备是很有利的。

比方说,你搜索 "fruiser "这个词,作为类别,它在德语中是指理发师。

https://www.google.com/maps/search/fruiser,+Adlershof,+Berlin,+Germany/@52.4362113,13.5494365,14z/data=!3m1!4b1?hl=de

作为搜索的结果,谷歌地图将向你显示为这个词定义的类别。它是friseursalon。用这个定义的类别(friseursalon)创建一个任务将给你带来完整和正确的结果。

当类别被确定为所需的语言时,在开始任务之前,有一个非常重要的设置必须进行。就是从预先参数语言部分选择正确的语言。

在正确设置语言和类别后,你可以查看过滤器部分。

过滤器

通过将子类型、类型、城市、邮政编码、州、站点、电话评级、商业状态和验证字段与 "包含一个"、"不包含一个"、"始于 "和 "非空白 "运算符结合起来,可以进行不同种类的过滤。

你可以看到在子类型和类型标题中 "包含一个 "运算符的使用,在网站标题中 "不包含 "运算符的使用,在评级标题中 "以 "运算符开始,以及在电话标题中 "不是空白 "运算符的使用。

子类型

在谷歌地图上注册的每个企业都被定义为一个类别和类型,同时也被定义为多个子类型。 

用这些参数做的任务的结果就是这样出来的。

从结果中可以看出,有些企业有许多子类型,如 "Fußpflege, Nagelstudio, Damen- und Herrenfriseur "以及 "Friseursalon "子类型。你可以使用这些子类型来提取你的目标企业。

我们要区分这些同时为男性和女性提供服务的理发店。子类型 "Damen- und Herrenfriseur "就表达了这一点。Damen- und Herrenfriseur "的翻译是女士和男士理发店。

为了做到这一点,需要在现有的子类型过滤器上增加另一个子类型过滤器。参数将以这种方式确定。

当两个子类型的过滤器都被用来消除时,似乎只有包含 "Damen- und Herrenfriseur "子类型数据的行留在结果文件中。

通过检查目标中企业的子类型,你可以确定一个高级过滤器设置,并在其上创建大批量任务。

类型

与子类型过滤器相比,类型过滤器只有一个变量数据。出于这个原因,当你用类型过滤器过滤你的任务时,你会得到一个鲜明的结果。

当我们为 "friseursalon "类别创建一个带有类型过滤器的任务时,我们得到的结果有一些不同。

任何在类型部分写的除 "Friseursalon "以外的结果都不包括在结果文件中。由于这个原因,出现在子类型过滤器结果中的 "AK Haarstudio",在用类型过滤器创建的任务结果文件中是没有的。你可以下载文件进行比较。

带有子类型过滤器的任务。 边缘人-子类型-过滤器

带有类型过滤器的任务。 滤波器

根据你想在结果文件中列出哪种类型的结果,使用子类型或类型过滤将是合适的。

场地

网站过滤器是用来做网站过滤的。一个用例是下面的例子。你想搜索一个城市的所有餐馆,但你不想让麦当劳的分店出现在结果中。麦当劳在其所有分店的Google Business记录中添加了它的网站。任务可以使用这个网站信息进行过滤。通过选择 "不包含 "参数,所有包含该网站的结果将被剔除。

当创建没有过滤的任务时,结果会有麦当劳的分支。 

查询。餐馆, 圣巴巴拉, CA, 美国

https://www.google.com/maps/search/restaurant%2C+Santa+Barbara%2C+CA%2C+United+States/?hl=en&gl=US


现在为不包括特定网站的结果设置参数和过滤器(www.mcdonalds.com)。

麦当劳的分支机构在新的过滤任务中被淘汰。

评价

当它想只搜刮具有某些评级的Google Places时,就会使用 "评级 "过滤器。

查询。餐馆, 圣巴巴拉, CA, 美国

https://www.google.com/maps/search/restaurant%2C+Santa+Barbara%2C+CA%2C+United+States/?hl=en&gl=US

这个查询结果中的餐馆有各种评分。你可能希望被搜刮的餐馆只有3个评级。因此,你可以使用一个评级过滤器,而不是搜刮所有的餐馆并手动清理其余的餐馆。因此,你可以节省时间和成本。

应打开高级参数菜单,通过点击添加过滤器选择评级字段。 

这里选择了 "以 "开始的运算符。因为在这些餐厅中,有一些地方的评分是3,3.1,3.6。因此,它涵盖了它们全部。如果选择 "包含其中之一 "运算符,并将3作为数值输入,那么评级为4.3的餐厅也会出现在结果中。

选择过滤器后,可以直接创建任务。

结果,只有3个评级的企业被废止了。这就是你如何使用 "始于 "运算符和 "评级 "字段过滤器。

电话

一些企业没有在其Google My Business账户中注册他们的电话号码。由于这个原因,这些企业的电话号码在谷歌地图上找不到。当你创建一个谷歌地图数据搜刮任务时,没有这个电话的企业也会被列入结果中。如果你想在结果中出现电话号码,你应该使用 "电话 "过滤器和 "不是空白 "操作符。

当用这些参数创建任务时,任何没有电话号码的企业将不包括在结果文件中。

业务状况

你可以在谷歌地图上看到一些公司暂时关闭。

这些业务的状态出现在结果文件的business_status栏中。

如果你只想搜刮处于 "运营 "状态的企业,只需使用 "包含其中之一 "操作符。

已验证

有些企业可能没有谷歌企业注册的验证。你可以在谷歌地图上看到这种情况,上面有 "声称此企业 "的字样。

这些企业的状态显示在Outscraper谷歌地图数据搜刮器结果文件中的 "已验证 "栏。 

如果你请求的结果文件只有经过验证的业务,那么使用 "经过验证的 "字段过滤器和 "包含其中之一 "操作符就足够了。

相反,如果你想看到未经验证的企业,只需输入 "FALSE "作为数值。

城市、邮政编码和州

城市、邮政编码和州的参数通常在创建任务时在 "地点 "参数中设置。然而,如果需要特殊的过滤,你可以使用 "包含一个"、"不包含一个"、"以 "和 "不是空白 "的操作符来过滤任务,如上面的例子。


尤努斯

市场营销人员、内容写作人员、客户体验开发人员----。 Facebook | 领英 | 推特

0 评论

发表评论

头像占位符