コラム
本記事は、11/6に開催したこちらのウェビナー動画の内容をダイジェストでご紹介します。
今回は「チュートリアル中級編 レッスン1」として、Webサイトから表形式の情報を一覧で取得する「webスクレイピング」の基本操作に焦点を当て、シナリオ作成のデモンストレーションが行われました 。
当日のセミナー内容を元に、発注ページの表から商品名リストを抽出し、Google spreadsheetに自動で転記するシナリオの作成方法を詳しく解説します。
webスクレイピングとは、Webサイトから特定の情報を自動で抽出・取得する機能のことです。
例えば、今回のウェビナーでは、EC管理サイトのような発注ページにある表の中から、「商品名」の列データ(スイートピーからカトレアまでの12個の品目)のみを一覧として抜き出してくる、といった操作を行いました 。さらに、取得したそれらの商品名を、Google spreadsheetやExcelのような表計算ソフトに転記するところまでを自動化しました。
本ウェビナーでは、「発注ページに表示されている12個の商品名を一覧で取得し、新しく作成したspreadsheetに貼り付ける」というシナリオを作成しました。
今回はGoogle spreadsheetを使用しますが、Excelをご利用の方も、アクションを置き換えることで同様のシナリオを作成可能です。
まず、対象のWebページにアクセスし、Coopel Selector Helperの機能を使ってwebスクレイピングの設定を行います。
今回は花の発注ページから情報を抽出します。


次に、取得したいデータがどの範囲にあるかをCoopelに認識させます。



Webサイトから取得する設定が完了したら、次はそのデータを転記するGoogle Spreadsheet側の設定を行います。



実行ボタンをクリックしてシナリオを実行します。 実行が完了した後、Google ドライブを確認すると、「チュートリアル中級編」というファイルが新規作成されていれば成功です。ファイルを開くと、「確認」シートのA1からA12セルにかけて、発注ページの商品名12個が正しく転記されていることが確認できました。


今回は中級編の第一歩として、webスクレイピングの基本的な使い方をご紹介しました。長いシナリオを作る際は、今回のように「まずスクレイピングだけ」といった形で、アクションを数個ずつ並べて部分的に実行し、できているかを確認しながら進める方法がおすすめです。
特定のWebサイトから定期的に情報を収集するといった作業は、Coopelが非常に得意とする分野です。本日の内容は、こうした情報収集業務を自動化する際の基本的な操作となりますので、ぜひご活用ください。
ご参加いただいた皆様、ありがとうございました。