目次を見る

Outscraper Google Mapsデータスクレイパー

グーグルマップデータスクレーパー は、Outscraperのサービスの中でも最も人気のあるスクレイパーの一つです。Outscraperでは毎日数百件のGoogle Mapsのスクレイピングタスクが作成されています。 

Parameters and filters should be set correctly in order to avoid irrelevant data in the results. We recommend to all our clients read our main tutorial about Google Maps Data Scraper first. It is “Googleマップをスクレイピングするには?

基本的なパラメータが正しく設定された後、期待に応じていくつかのフィルタを追加する必要があります。基本的なパラメータで小さなテストタスクを作成することで、結果を確認することができます。フィルターは結果ファイルを狭める可能性があります。以下に説明するフィルターが役に立つかもしれない。

Google Mapsデータスクレイパーサービスにフィルターを使用する理由と必要な時

Google Maps service shows results close to or similar to the searched category/keyword in the result list due to the easy and useful user experience that it wants to provide to its users.

例えば、ロサンゼルスで「韓国食料品店」を探したいと思い、Googleマップで「Korean grocery store near Los Angeles, CA, USA」と検索したとします。

https://www.google.com/maps/search/Korean+grocery+store+near+Los+Angeles,+CA,+USA/@34.0174722,-118.4280778,12z/data=!3m1!4b1!4m2!2m1!6e6

検索結果をスクロールすると、GoogleマップはKorean Grocery Storeに関連すると思われるAsian Grocery StoreとJapanese Grocery Storeの検索結果も表示しています。

Googleマップの検索結果

このような状況だと、どうしてもスクレイピングしたい結果が変わってしまうことがあります。なぜなら、Outscraper Google Maps Data Scraperは、検索されたクエリに対して、Google Mapsが表示する結果をスクレイピングするサービスだからです。 

Since Google Maps shows the Japanese Grocery Stores and Asian Grocery Stores in the results of this query, these results will also appear in the scraping task result file. このようなパラメータを使って、Outscraper Google Maps Data Scraperで「韓国食料品店」のカテゴリ/キーワードで検索を行います。

カテゴリー選択

このパラメータで直接検索すると、以下のように結果が表示されます。

リザルトファイルの種類

タスクの結果をフィルタなしでスクレイピングする。 韓国の食料品店

ご覧のように、スクレイピングタスクの結果でも、Google MapsのWebページと同様の結果が得られています。この検索では、食料品の種類が混在した結果を含む218件の結果が含まれています。しかし、あなたは韓国の食料品店の結果をスクレイピングしたいだけです。どのようにこれを行うのでしょうか?あなたはそれのために "高度なフィルタ "をチェックアウトする必要があります。

グーグルマップスクレイパーフィルタ

With the use of a subtype advanced filter, we can get the desired result with the same parameters.

タイプおよびサブタイプ

このフィルターで、特にサブタイプにKorean Grocery Storeを持つ結果を得ました。したがって、サブタイプにAsian Grocery StoreまたはJapanese Grocery Storeと定義され、Korean Grocery Storeと定義されていない結果はすべて除外されました。

サブタイプフィルターを使用したタスクのスクレイピング結果。 韓国食料品店(サブタイプ・フィルター付き

完全一致のカテゴリのみをスクレイピング

完全一致のカテゴリのみをスクレイピング

The “Scrape only exact match categories” option box in Google Maps Data Scraper service is a feature that lets users make simple filtering. When you click the “Scrape only exact match categories” option box, Outscraper will quickly generate a subtype filter as in the example above.

ここで最も重要な点は、この機能が「英語」に対してのみ機能することです。他の言語では、手動でフィルタリングを行う必要があります。

完全一致のカテゴリーとサブタイプの関係

If you need simple filtering like in the example above, the “Scrape only exact match categories” option box will be enough for you. If you need to do different and detailed filtering, you will need to look at the advanced filters in deeply.

高度なフィルタを使うには?

Advanced filtering settings can be accessed by clicking “Advanced parameters (language, filters, limit per query, columns, etc.)” text where you can set the language, various fields, and operators

アドバンストフィルタ

言語と正しいカテゴリーを使用する

世界中の様々な言語でGoogle Mapsを検索することができます。同様に、Outscraperを介してこれらの言語で検索することができます。ドイツ語で使用されるカテゴリを使用する場合は、ここのリストからドイツ語を選択する必要があります。

Outscraperの中で一般的に使われている英語カテゴリのリストがあります。こちらに掲載されています。 

Googleマップのビジネスカテゴリ

このリストにあるカテゴリの直訳は、他の言語では必ずしも正確でない場合があります。このため、正しいカテゴリー用語を見つけるために、少し下調べをする必要があるかもしれません。

Apart from the translations, the keyword/category you want to search for may be defined differently on Google Maps. It is advantageous to make preliminary preparations without creating large tasks.

Let’s say you search for the word “fruiser” as a category, which means barber in German.

https://www.google.com/maps/search/fruiser,+Adlershof,+Berlin,+Germany/@52.4362113,13.5494365,14z/data=!3m1!4b1?hl=de

Googleマップのカテゴリ

検索の結果、Googleマップにはこの単語で定義されたカテゴリが表示されます。それはfriseursalonです。この定義されたカテゴリー(friseursalon)でタスクを作成すると、完全で正しい結果が得られます。

適切なカテゴリーを見つける・使う

When the category is determined in the desired language, there is a very important setting that must be made before starting the task. It is to choose the right language from the advanced parameters language section.

言語選択

言語とカテゴリーを正しく設定したら、フィルターセクションをチェックします。

フィルター

フィルター

Different kinds of filtering are possible by combining the subtypes, type, city, postal code, state, site, phone rating, business status, and verified fields together with the “contains one of”, “contains none of”, “starts with”, “equals”, “is blank” and “is not blank” operators.

subtypeとtypeヘッダのcontains one of演算子、siteヘッダのcontains none of演算子、ratingヘッダのstarts with演算子、phoneヘッダのis not blank演算子が使われているのがわかると思います。

サブタイプ

Each business registered in Google Maps is defined with a category and type and also defined with multiple subtypes. 

フィルタリングのサブタイプ

このようなパラメータで作ったタスクの結果は、こうなります。

サブタイプ

As seen in the results, there are businesses that have many subtypes such as “Fußpflege, Nagelstudio, Damen- und Herrenfriseur” along with the “Friseursalon” subtype. You can use these subtypes to extract the businesses you are targeting.

ここでは、これらの理髪店のうち、男性向けと女性向けのサービスを提供する店を区別して考えたい。これを表現するのが "Damen- und Herrenfriseur "というサブタイプである。Damen- und Herrenfriseur "を訳すと、紳士淑女の美容室となる。

そのためには、既存のサブタイプフィルタに、別のサブタイプフィルタを追加する必要があります。パラメータはこのように決定される。

サブタイプフィルタの使用

両方のサブタイプフィルターを用いて消去したところ、「Damen- und Herrenfriseur」のサブタイプデータを含む行だけが結果ファイルに残ったようです。

フィルタリング結果

対象企業のサブタイプを調べることで、高度なフィルタ設定を決定し、その上で大容量のタスクを作成することができます。

サイト

Site filter offers the opportunity to filter businesses by whether they have a website or not while scraping Google Maps. Thus, it is possible to list only businesses without websites.

Website Filter Options

This filter has two options. “is not blank” and “is blank”. When the “is blank” operator is selected, only non-website businesses are listed in the result file. The opposite happens with the “is not blank” operator, only businesses with websites will be included in the result file.

Query:  HVAC Contractors, Los Angeles, CA, United States

https://www.google.com/maps/search/hvac+contractor,+Los+Angeles,+CA,+US/@34.0756363,-118.3382884,11z/data=!3m1!4b1?hl=en

HVAC Contractors on Los Angeles

As in the example query, some businesses have websites in their Google Maps profiles; some of them don’t. With this filter, it is possible to separate these businesses.

Creating Tasks With Website Filter

With these parameters, we will have created a task to extract only businesses that do not have a website.

Task Result File

As seen in the task result file, all businesses that do not have a website are listed. If the “is not blank” operator was selected, all businesses on this list would be eliminated and all other businesses with websites would be listed.

評価

評価 "フィルタは、特定の評価を持つGoogleプレイスのみをスクレイピングしたい場合に使用します。

クエリレストラン, サンタバーバラ, カリフォルニア州, アメリカ合衆国

https://www.google.com/maps/search/restaurant%2C+Santa+Barbara%2C+CA%2C+United+States/?hl=en&gl=US

The restaurants in the results of this query have various ratings. You may want to scrape restaurants with only 3 ratings. So instead of scraping all the restaurants and cleaning the rest manually, you can use a rating filter. Thus, you save time and cost.

リザルトファイルの評価

Advanced parameters menu should be opened and the rating field should be selected by clicking add filter. 

Here the “starts with” operator are selected. Because among the restaurants, there are places with ratings such as 3, 3.1, 3.6. Thus, it covers them all. If the “contains one of” operator was selected and 3 was entered as a value, restaurants with a rating of 4.3 would also appear in the results.

定格フィルタ

フィルタを選択した後、直接タスクを作成することができます。

タスクの結果

その結果、評価が3つしかない企業はスクラップされることになりました。このように、"starts with "演算子と "rating "フィールドのフィルタリングを使うことができます。

電話

リザルトファイルの電話機データ

一部の企業は、Googleマイビジネスのアカウントに電話番号を登録していません。このため、これらの企業の電話番号はGoogleマップ上で見つけることができません。Google Maps Data Scraperのタスクを作成すると、この電話を持っていないビジネスも結果に含まれるようになります。もし結果に電話番号を表示させたい場合は、「電話」フィルタと「is not blank」演算子を使うとよいでしょう。

電話機フィルター

When the task is created with these parameters, any business that does not have a phone number will not be included in the result file.

タスクの結果

経営状況

グーグルマップでは、一時的に休業している会社も見受けられます。

Google Mapsでのビジネスステータス

これらのビジネスの状況は、結果ファイルのbusiness_statusカラムに表示されます。

リザルトファイルのビジネスステータス

もし、"OPERATIONAL "ステータスのビジネスだけをスクレイピングしたい場合は、"contains one of "演算子を使用すればよいでしょう。

運用状況

検証済み

ビジネスによっては、Googleビジネス登録の確認が取れていない場合があります。このような状況は、Googleマップの「このビジネスを主張する」というフレーズで確認することができます。

このビジネスを主張する

これらの企業の状況は、Outscraper Google Maps Data Scraperの結果ファイルの「verified」欄に表示されています。 

検証済み TRUE - FALSE

If you are requesting a result file that only has to verify businesses, it is sufficient to use the “verified” field filter and the “contains one of” operator.

検証済みフィルター

逆に、検証されていない企業を表示したい場合は、値として「FALSE」を入力すれば十分です。

検証値

郵便番号

ロケーションのフィルタリング

通常はGoogle Mapsで検索する場所を選択しますが、特別なフィルタリングが必要な場合は、上記の例のように「includes one of」「contains none of」「start with」「is not blank」演算子を使ってタスクをフィルタリングすることが可能です。

高度なフィルターを使ってタスクを作成できるようになりました。まず、小さなタスクを作成して、フィルターをテストしてください。その結果を承認すれば、より多くの場所を選択した、より大きなタスクを作成することができます。

ビデオチュートリアル

よくある質問

最も頻繁な質問と回答

Outscraper Google Maps Scraperアプリのダッシュボードで、スクレイピングタスクのために様々な種類のフィルタを作成することができます。

ニッチなカテゴリーに属するすべてのビジネスをGoogle Maps上で簡単に見つけることができます。サブタイプ」フィルターを使用して、スクレイピング結果ファイルを絞り込むだけです。

Outscraper Google Maps Scraperのウェブサイトフィルターを使うと、ウェブサイトがない企業も見つけることができます。フィールドで「サイト」フィルタを選択し、演算子を「空白」と設定します。Outscraperは、ウェブサイトを持たない企業を全て探し出します。

郵便番号は、Google Mapsのスクレイピング結果ファイルをフィルタリングするために使用することができます。郵便番号の形式が正しいことを確認し、ダッシュボードで "postal_code" フィルタを追加してください。

Outscraper Google Maps Data Scraperは、"business_status "フィルタにより、事業内容から企業を探すことができます。フィルタの値は以下のように定義できる。

オペレーショナル
一時休業中
クローズド_パーマネント


ユヌス

マーケター、コンテンツライター、カスタマーエクスペリエンスデベロッパー-。 フェイスブック | Linkedin | ツイッター

0のコメント

コメントを残す

アバタープレースホルダー