目次を見る

Outscraper Google Mapsデータスクレイパー

グーグルマップデータスクレーパー は、Outscraperのサービスの中でも最も人気のあるスクレイパーの一つです。Outscraperでは毎日数百件のGoogle Mapsのスクレイピングタスクが作成されています。 

Parameters and filters should be set correctly in order to avoid irrelevant data in the results. We recommend to all our clients read our main tutorial about Google Maps Data Scraper first. It is “How to Scrape Google Maps?

基本的なパラメータが正しく設定された後、期待に応じていくつかのフィルタを追加する必要があります。基本的なパラメータで小さなテストタスクを作成することで、結果を確認することができます。フィルターは結果ファイルを狭める可能性があります。以下に説明するフィルターが役に立つかもしれない。

Why and When do you Need to Use Filters for Google Maps Data Scraper Service?

Google Maps service shows results close to or similar to the searched category/keyword in the result list due to the easy and useful user experience that it wants to provide to its users.

For example, you want to find “Korean Grocery Stores” in Los Angeles, and you searched “Korean Grocery Stores near Los Angeles, CA, USA” on Google Maps.

https://www.google.com/maps/search/Korean+grocery+store+near+Los+Angeles,+CA,+USA/@34.0174722,-118.4280778,12z/data=!3m1!4b1!4m2!2m1!6e6

検索結果をスクロールすると、GoogleマップはKorean Grocery Storeに関連すると思われるAsian Grocery StoreとJapanese Grocery Storeの検索結果も表示しています。

Googleマップの検索結果

このような状況だと、どうしてもスクレイピングしたい結果が変わってしまうことがあります。なぜなら、Outscraper Google Maps Data Scraperは、検索されたクエリに対して、Google Mapsが表示する結果をスクレイピングするサービスだからです。

Since Google Maps shows the Japanese Grocery Stores and Asian Grocery Stores in the results of this query, these results will also appear in the scraping task result file. You use a parameter like this to perform a search with the “Korean Grocery Store” category/keyword in Outscraper Google Maps Data Scraper.

カテゴリー選択

このパラメータで直接検索すると、以下のように結果が表示されます。

リザルトファイルの種類

タスクの結果をフィルタなしでスクレイピングする。 韓国の食料品店

ご覧のように、スクレイピングタスクの結果でも、Google MapsのWebページと同様の結果が得られています。この検索では、食料品の種類が混在した結果を含む218件の結果が含まれています。しかし、あなたは韓国の食料品店の結果をスクレイピングしたいだけです。どのようにこれを行うのでしょうか?あなたはそれのために "高度なフィルタ "をチェックアウトする必要があります。

グーグルマップスクレイパーフィルタ

サブタイプアドバンスドフィルターを使えば、同じパラメータで目的の結果を得ることができる。

タイプおよびサブタイプ

We got results that especially have a Korean Grocery Store in their subtype with this filter. Thus, all results that were defined as Asian Grocery Store or Japanese Grocery Store in the subtype but not Korean Grocery Store were eliminated.

サブタイプフィルターを使用したタスクのスクレイピング結果。 韓国食料品店(サブタイプ・フィルター付き

完全一致のカテゴリのみをスクレイピング

完全一致のカテゴリのみをスクレイピング

Google Maps Data Scraperの「Scrape only exact match categories」オプションボックスは、簡単なフィルタリングを行うことができる機能です。Scrape only exact match categories" オプションボックスをクリックすると、Outscraperは上の例のようにサブタイプのフィルタを素早く生成します。

ここで最も重要な点は、この機能が「英語」に対してのみ機能することです。他の言語では、手動でフィルタリングを行う必要があります。

完全一致のカテゴリーとサブタイプの関係

If you need simple filtering, like in the example above, the “Scrape only exact match categories” option box will be enough for you. If you need to do different and more detailed filtering, you will need to look at the advanced filters more closely.

高度なフィルタを使うには?

Advanced filtering settings can be accessed by clicking “Advanced parameters (language, filters, limit per query, columns, etc.)” text, where you can set the language, various fields, and operators.

アドバンストフィルタ

言語と正しいカテゴリーを使用する

世界中の様々な言語でGoogle Mapsを検索することができます。同様に、Outscraperを介してこれらの言語で検索することができます。ドイツ語で使用されるカテゴリを使用する場合は、ここのリストからドイツ語を選択する必要があります。

Outscraperの中で一般的に使われている英語カテゴリのリストがあります。こちらに掲載されています。

Googleマップのビジネスカテゴリ

このリストにあるカテゴリの直訳は、他の言語では必ずしも正確でない場合があります。このため、正しいカテゴリー用語を見つけるために、少し下調べをする必要があるかもしれません。

翻訳とは別に、検索したいキーワード・カテゴリがGoogleマップ上で異なる定義になっている場合があります。大きなタスクを作らず、事前準備をすることが有利です。

Let’s say you search for the word “fruiser” as a category, which means barber in German.

https://www.google.com/maps/search/fruiser,+Adlershof,+Berlin,+Germany/@52.4362113,13.5494365,14z/data=!3m1!4b1?hl=de

Googleマップのカテゴリ

検索の結果、Googleマップにはこの単語で定義されたカテゴリが表示されます。それはfriseursalonです。この定義されたカテゴリー(friseursalon)でタスクを作成すると、完全で正しい結果が得られます。

適切なカテゴリーを見つける・使う

希望する言語でカテゴリが決定された場合、タスクを開始する前に行わなければならない非常に重要な設定があります。それは、advance parameters languageの項目から、正しい言語を選択することです。

言語選択

言語とカテゴリーを正しく設定したら、フィルターセクションをチェックします。

フィルター

フィルター

サブタイプ、タイプ、都市、郵便番号、州、サイト、電話格付け、ビジネスステータス、検証済みフィールドを、「~を含む」「~を含まない」「~で始まる」「~と等しい」「~が空白」「~でない」オペレータと組み合わせて、さまざまな種類のフィルタリングが可能です。

subtypeとtypeヘッダのcontains one of演算子、siteヘッダのcontains none of演算子、ratingヘッダのstarts with演算子、phoneヘッダのis not blank演算子が使われているのがわかると思います。

サブタイプ

Each business registered in Google Maps is defined by a category and type, as well as multiple subtypes.

フィルタリングのサブタイプ

このようなパラメータで作ったタスクの結果は、こうなります。

サブタイプ

結果を見てみると、「Fußpflege, Nagelstudio, Damen- und Herrenfriseur」というサブタイプに加え、「Friseursalon」というサブタイプを多く持つビジネスが存在することがわかる。これらのサブタイプを使用して、ターゲットとするビジネスを抽出することができます。

ここでは、これらの理髪店のうち、男性向けと女性向けのサービスを提供する店を区別して考えたい。これを表現するのが "Damen- und Herrenfriseur "というサブタイプである。Damen- und Herrenfriseur "を訳すと、紳士淑女の美容室となる。

そのためには、既存のサブタイプフィルタに、別のサブタイプフィルタを追加する必要があります。パラメータはこのように決定される。

サブタイプフィルタの使用

両方のサブタイプフィルターを用いて消去したところ、「Damen- und Herrenfriseur」のサブタイプデータを含む行だけが結果ファイルに残ったようです。

フィルタリング結果

対象企業のサブタイプを調べることで、高度なフィルタ設定を決定し、その上で大容量のタスクを作成することができます。

サイト

Site filter offers the opportunity to filter businesses by whether they have a website or not while scraping Google Maps. Thus, it is possible to list only businesses without websites.

Website Filter Options

This filter has two options. “is not blank” and “is blank”. When the “is blank” operator is selected, only non-website businesses are listed in the result file. The opposite happens with the “is not blank” operator, only businesses with websites will be included in the result file.

Query:  HVAC Contractors, Los Angeles, CA, United States

https://www.google.com/maps/search/hvac+contractor,+Los+Angeles,+CA,+US/@34.0756363,-118.3382884,11z/data=!3m1!4b1?hl=en

HVAC Contractors on Los Angeles

As in the example query, some businesses have websites in their Google Maps profiles; some of them don’t. With this filter, it is possible to separate these businesses.

Creating Tasks With Website Filter

With these parameters, we will have created a task to extract only businesses that do not have a website.

Task Result File

As seen in the task result file, all businesses that do not have a website are listed. If the “is not blank” operator was selected, all businesses on this list would be eliminated, and all other businesses with websites would be listed.

評価

評価 "フィルタは、特定の評価を持つGoogleプレイスのみをスクレイピングしたい場合に使用します。

クエリレストラン, サンタバーバラ, カリフォルニア州, アメリカ合衆国

https://www.google.com/maps/search/restaurant%2C+Santa+Barbara%2C+CA%2C+United+States/?hl=en&gl=US

このクエリの結果に含まれるレストランは、さまざまな評価を受けています。レーティングが3つしかないレストランをスクラップしたい場合もあるでしょう。そこで、すべてのレストランをスクラップし、残りを手動でクリーニングする代わりに、評価フィルタを使用することができます。こうして、時間とコストを節約することができます。

リザルトファイルの評価

詳細パラメータメニューを開き、フィルタの追加をクリックしてレーティングフィールドを選択する必要があります。 

ここでは、"starts with "演算子が選択されている。なぜなら、レストランの中には、3、3.1、3.6といった評価を持つ店があるからだ。したがって、それらすべてをカバーすることになる。もし、「contains one of」演算子が選択され、値として3が入力された場合、評価が4.3のレストランも結果に表示されることになります。

定格フィルタ

フィルタを選択した後、直接タスクを作成することができます。

タスクの結果

その結果、評価が3つしかない企業はスクラップされることになりました。このように、"starts with "演算子と "rating "フィールドのフィルタリングを使うことができます。

電話

リザルトファイルの電話機データ

Some businesses don’t register their phone numbers with their Google My Business accounts. For this reason, the phone numbers of these businesses are not found on Google Maps. When you create a Google Maps Data Scraper task, businesses that do not have this phone will also be included in the results. If you only want businesses with phone numbers in your results, use the “Phone” filter and the “is not blank” operator.

電話機フィルター

このパラメータでタスクを作成した場合、電話番号のないビジネスは結果ファイルに含まれません。

タスクの結果

経営状況

You can see that some companies are temporarily closed on Google Maps.

Google Mapsでのビジネスステータス

これらのビジネスの状況は、結果ファイルのbusiness_statusカラムに表示されます。

リザルトファイルのビジネスステータス

もし、"OPERATIONAL "ステータスのビジネスだけをスクレイピングしたい場合は、"contains one of "演算子を使用すればよいでしょう。

運用状況

検証済み

Some businesses may not have verified their Google Business registration. You can see this situation on Google Maps with the phrase “Claim this business”.

このビジネスを主張する

これらの企業の状況は、Outscraper Google Maps Data Scraperの結果ファイルの「verified」欄に表示されています。 

検証済み TRUE - FALSE

検証済みビジネスのみを含む結果ファイルを要求する場合は、"verified" field filter と "contains one of" operator を使用すれば十分です。

検証済みフィルター

逆に、検証されていない企業を表示したい場合は、値として「FALSE」を入力すれば十分です。

検証値

郵便番号

ロケーションのフィルタリング

通常はGoogle Mapsで検索する場所を選択しますが、特別なフィルタリングが必要な場合は、上記の例のように「includes one of」「contains none of」「start with」「is not blank」演算子を使ってタスクをフィルタリングすることが可能です。

高度なフィルターを使ってタスクを作成できるようになりました。まず、小さなタスクを作成して、フィルターをテストしてください。その結果を承認すれば、より多くの場所を選択した、より大きなタスクを作成することができます。

よくある質問

最も頻繁な質問と回答

Outscraper Google Maps Scraperアプリのダッシュボードで、スクレイピングタスクのために様々な種類のフィルタを作成することができます。

ニッチなカテゴリーに属するすべてのビジネスをGoogle Maps上で簡単に見つけることができます。サブタイプ」フィルターを使用して、スクレイピング結果ファイルを絞り込むだけです。

Outscraper Google Maps Scraperのウェブサイトフィルターを使うと、ウェブサイトがない企業も見つけることができます。フィールドで「サイト」フィルタを選択し、演算子を「空白」と設定します。Outscraperは、ウェブサイトを持たない企業を全て探し出します。

郵便番号は、Google Mapsのスクレイピング結果ファイルをフィルタリングするために使用することができます。郵便番号の形式が正しいことを確認し、ダッシュボードで "postal_code" フィルタを追加してください。

Outscraper Google Maps Data Scraperは、"business_status "フィルタにより、事業内容から企業を探すことができます。フィルタの値は以下のように定義できる。

オペレーショナル
一時休業中
クローズド_パーマネント


ユヌス

マーケター、コンテンツライター、カスタマーエクスペリエンスデベロッパー-。 フェイスブック | Linkedin | ツイッター

0のコメント

コメントを残す

アバタープレースホルダー