目次を見る
Outscraper Google Mapsデータスクレイパー
グーグルマップデータスクレーパー は、Outscraperのサービスの中でも最も人気のあるスクレイパーの一つです。Outscraperでは毎日数百件のGoogle Mapsのスクレイピングタスクが作成されています。
Parameters and filters should be set correctly in order to avoid irrelevant data in the results. We recommend to all our clients read our main tutorial about Google Maps Data Scraper first. It is “Googleマップをスクレイピングするには?“
基本的なパラメータが正しく設定された後、期待に応じていくつかのフィルタを追加する必要があります。基本的なパラメータで小さなテストタスクを作成することで、結果を確認することができます。フィルターは結果ファイルを狭める可能性があります。以下に説明するフィルターが役に立つかもしれない。
Google Mapsデータスクレイパーサービスにフィルターを使用する理由と必要な時
Google Maps service shows results close to or similar to the searched category/keyword in the result list due to the easy and useful user experience that it wants to provide to its users.
例えば、ロサンゼルスで「韓国食料品店」を探したいと思い、Googleマップで「Korean grocery store near Los Angeles, CA, USA」と検索したとします。
検索結果をスクロールすると、GoogleマップはKorean Grocery Storeに関連すると思われるAsian Grocery StoreとJapanese Grocery Storeの検索結果も表示しています。
このような状況だと、どうしてもスクレイピングしたい結果が変わってしまうことがあります。なぜなら、Outscraper Google Maps Data Scraperは、検索されたクエリに対して、Google Mapsが表示する結果をスクレイピングするサービスだからです。
Since Google Maps shows the Japanese Grocery Stores and Asian Grocery Stores in the results of this query, these results will also appear in the scraping task result file. このようなパラメータを使って、Outscraper Google Maps Data Scraperで「韓国食料品店」のカテゴリ/キーワードで検索を行います。
このパラメータで直接検索すると、以下のように結果が表示されます。
タスクの結果をフィルタなしでスクレイピングする。 韓国の食料品店
ご覧のように、スクレイピングタスクの結果でも、Google MapsのWebページと同様の結果が得られています。この検索では、食料品の種類が混在した結果を含む218件の結果が含まれています。しかし、あなたは韓国の食料品店の結果をスクレイピングしたいだけです。どのようにこれを行うのでしょうか?あなたはそれのために "高度なフィルタ "をチェックアウトする必要があります。
With the use of a subtype advanced filter, we can get the desired result with the same parameters.
このフィルターで、特にサブタイプにKorean Grocery Storeを持つ結果を得ました。したがって、サブタイプにAsian Grocery StoreまたはJapanese Grocery Storeと定義され、Korean Grocery Storeと定義されていない結果はすべて除外されました。
サブタイプフィルターを使用したタスクのスクレイピング結果。 韓国食料品店(サブタイプ・フィルター付き
完全一致のカテゴリのみをスクレイピング
The “Scrape only exact match categories” option box in Google Maps Data Scraper service is a feature that lets users make simple filtering. When you click the “Scrape only exact match categories” option box, Outscraper will quickly generate a subtype filter as in the example above.
ここで最も重要な点は、この機能が「英語」に対してのみ機能することです。他の言語では、手動でフィルタリングを行う必要があります。
If you need simple filtering like in the example above, the “Scrape only exact match categories” option box will be enough for you. If you need to do different and detailed filtering, you will need to look at the advanced filters in deeply.
高度なフィルタを使うには?
言語と正しいカテゴリーを使用する
世界中の様々な言語でGoogle Mapsを検索することができます。同様に、Outscraperを介してこれらの言語で検索することができます。ドイツ語で使用されるカテゴリを使用する場合は、ここのリストからドイツ語を選択する必要があります。
Outscraperの中で一般的に使われている英語カテゴリのリストがあります。こちらに掲載されています。
Googleマップのビジネスカテゴリ
このリストにあるカテゴリの直訳は、他の言語では必ずしも正確でない場合があります。このため、正しいカテゴリー用語を見つけるために、少し下調べをする必要があるかもしれません。
Apart from the translations, the keyword/category you want to search for may be defined differently on Google Maps. It is advantageous to make preliminary preparations without creating large tasks.
Let’s say you search for the word “fruiser” as a category, which means barber in German.
検索の結果、Googleマップにはこの単語で定義されたカテゴリが表示されます。それはfriseursalonです。この定義されたカテゴリー(friseursalon)でタスクを作成すると、完全で正しい結果が得られます。
When the category is determined in the desired language, there is a very important setting that must be made before starting the task. It is to choose the right language from the advanced parameters language section.
言語とカテゴリーを正しく設定したら、フィルターセクションをチェックします。
フィルター
Different kinds of filtering are possible by combining the subtypes, type, city, postal code, state, site, phone rating, business status, and verified fields together with the “contains one of”, “contains none of”, “starts with”, “equals”, “is blank” and “is not blank” operators.
subtypeとtypeヘッダのcontains one of演算子、siteヘッダのcontains none of演算子、ratingヘッダのstarts with演算子、phoneヘッダのis not blank演算子が使われているのがわかると思います。
サブタイプ
Each business registered in Google Maps is defined with a category and type and also defined with multiple subtypes.
このようなパラメータで作ったタスクの結果は、こうなります。
As seen in the results, there are businesses that have many subtypes such as “Fußpflege, Nagelstudio, Damen- und Herrenfriseur” along with the “Friseursalon” subtype. You can use these subtypes to extract the businesses you are targeting.
ここでは、これらの理髪店のうち、男性向けと女性向けのサービスを提供する店を区別して考えたい。これを表現するのが "Damen- und Herrenfriseur "というサブタイプである。Damen- und Herrenfriseur "を訳すと、紳士淑女の美容室となる。
そのためには、既存のサブタイプフィルタに、別のサブタイプフィルタを追加する必要があります。パラメータはこのように決定される。
サイト
Site filter offers the opportunity to filter businesses by whether they have a website or not while scraping Google Maps. Thus, it is possible to list only businesses without websites.
This filter has two options. “is not blank” and “is blank”. When the “is blank” operator is selected, only non-website businesses are listed in the result file. The opposite happens with the “is not blank” operator, only businesses with websites will be included in the result file.
Query: HVAC Contractors, Los Angeles, CA, United States
As in the example query, some businesses have websites in their Google Maps profiles; some of them don’t. With this filter, it is possible to separate these businesses.
With these parameters, we will have created a task to extract only businesses that do not have a website.
As seen in the task result file, all businesses that do not have a website are listed. If the “is not blank” operator was selected, all businesses on this list would be eliminated and all other businesses with websites would be listed.
評価
評価 "フィルタは、特定の評価を持つGoogleプレイスのみをスクレイピングしたい場合に使用します。
クエリレストラン, サンタバーバラ, カリフォルニア州, アメリカ合衆国
https://www.google.com/maps/search/restaurant%2C+Santa+Barbara%2C+CA%2C+United+States/?hl=en&gl=US
The restaurants in the results of this query have various ratings. You may want to scrape restaurants with only 3 ratings. So instead of scraping all the restaurants and cleaning the rest manually, you can use a rating filter. Thus, you save time and cost.
Advanced parameters menu should be opened and the rating field should be selected by clicking add filter.
Here the “starts with” operator are selected. Because among the restaurants, there are places with ratings such as 3, 3.1, 3.6. Thus, it covers them all. If the “contains one of” operator was selected and 3 was entered as a value, restaurants with a rating of 4.3 would also appear in the results.
フィルタを選択した後、直接タスクを作成することができます。
When the task is created with these parameters, any business that does not have a phone number will not be included in the result file.
経営状況
グーグルマップでは、一時的に休業している会社も見受けられます。
これらのビジネスの状況は、結果ファイルのbusiness_statusカラムに表示されます。
もし、"OPERATIONAL "ステータスのビジネスだけをスクレイピングしたい場合は、"contains one of "演算子を使用すればよいでしょう。
検証済み
ビジネスによっては、Googleビジネス登録の確認が取れていない場合があります。このような状況は、Googleマップの「このビジネスを主張する」というフレーズで確認することができます。
これらの企業の状況は、Outscraper Google Maps Data Scraperの結果ファイルの「verified」欄に表示されています。
If you are requesting a result file that only has to verify businesses, it is sufficient to use the “verified” field filter and the “contains one of” operator.
逆に、検証されていない企業を表示したい場合は、値として「FALSE」を入力すれば十分です。
よくある質問
最も頻繁な質問と回答
Outscraper Google Maps Scraperアプリのダッシュボードで、スクレイピングタスクのために様々な種類のフィルタを作成することができます。
ニッチなカテゴリーに属するすべてのビジネスをGoogle Maps上で簡単に見つけることができます。サブタイプ」フィルターを使用して、スクレイピング結果ファイルを絞り込むだけです。
Outscraper Google Maps Scraperのウェブサイトフィルターを使うと、ウェブサイトがない企業も見つけることができます。フィールドで「サイト」フィルタを選択し、演算子を「空白」と設定します。Outscraperは、ウェブサイトを持たない企業を全て探し出します。
郵便番号は、Google Mapsのスクレイピング結果ファイルをフィルタリングするために使用することができます。郵便番号の形式が正しいことを確認し、ダッシュボードで "postal_code" フィルタを追加してください。
Outscraper Google Maps Data Scraperは、"business_status "フィルタにより、事業内容から企業を探すことができます。フィルタの値は以下のように定義できる。
オペレーショナル
一時休業中
クローズド_パーマネント
0のコメント