清水さんはUdemyの講座も(自分も受講してます)あり、かなり詳しくHTMLの基礎、要素の取得、スクレイピングの方法等を解説しています。
書籍の後半以外は講座の内容と同じ内容になっていますので、講座を受講しながらだと更に解りやすいと思います。
スクレイピングについて解説している書籍は色々ありますが、この書籍が基礎から応用まで身につけるには一番良いと思います。
Kindle 価格: | ¥1,940 (税込) |
獲得ポイント: | 116ポイント (6%) |
を購読しました。 続刊の配信が可能になってから24時間以内に予約注文します。最新刊がリリースされると、予約注文期間中に利用可能な最低価格がデフォルトで設定している支払い方法に請求されます。
「メンバーシップおよび購読」で、支払い方法や端末の更新、続刊のスキップやキャンセルができます。
エラーが発生しました。 エラーのため、お客様の定期購読を処理できませんでした。更新してもう一度やり直してください。
無料のKindleアプリをダウンロードして、スマートフォン、タブレット、またはコンピューターで今すぐKindle本を読むことができます。Kindleデバイスは必要ありません。
ウェブ版Kindleなら、お使いのブラウザですぐにお読みいただけます。
携帯電話のカメラを使用する - 以下のコードをスキャンし、Kindleアプリをダウンロードしてください。
Python最速データ収集術 〜スクレイピングでWeb情報を自動で集める IT×仕事術 Kindle版
(概要)
「競合商品のデータを毎回探すのは大変」
「常にチェックしている売上ランキングをまとめおきたい」
「情報を集めるのに手間取って、じっくり分析する時間がない」
こんな情報収集の悩みは、プログラムを使えば解決できます!
多くのビジネスにおいて、自社や他社の商品情報や人気トレンド、口コミ評判などのデータ収集・分析は欠かせません。しかし、膨大なネット上の情報を手作業で集めるのは容易ではありません。データ収集に時間がかかりすぎてしまい、本来の目的である分析に時間をかけられないケースも多いでしょう。
そんなときは、データ収集をプログラムで自動化してみましょう!
本書では、プログラミング言語Python(パイソン)を使ったスクレイピングという技術で、WebページやSNSなどから自動でデータ収集する方法を学べます。初心者でも実践できるように、プログラミングやWebページのしくみの知識は必要最小限に抑え、練習用のページやサンプルのプログラムでスクレイピングを実践しながら学びます。練習用ページなどには、実際のビジネス利用シーンをイメージしやすい事例を用意しました。
プログラミングで業務を自動化・効率化したいビジネスパーソン必見の1冊です!
(こんな方におすすめ)
・データ収集の作業を効率化したいビジネスパーソン
(目次)
第1章 データ収集をハックする
1-1 プログラムを使って自動でデータを集める
1-2 自動で集められるデータとは
1-3 自動収集の注意点を押さえる
第2章 Webからデータを集める準備
2-1 データ収集に役立つPython
2-2 Pythonが使える環境を準備する
2-3 Python超入門
第3章 データ自動収集のしくみを押さえる
3-1 Webページ・WebAPIのしくみを理解する
3-2 データのフォーマットや種類を理解する
3-3 Webページからデータを取得する方法を理解する
3-4 ステップ1:HTMLをダウンロードする
3-5 ステップ2:データを抽出する
3-6 ステップ3:データを保存する
3-7 Webページから実際にデータを取得する
第4章 Pythonでデータを自動で集める
4-1 売れ筋ランキング情報を収集しよう
4-2 人気商品の画像情報を集めよう
4-3 メディアから記事情報を収集しよう
4-4 オープンデータの統計情報を収集しよう
4-5 TwitterAPIから口コミ情報を集めよう
第5章 集めたデータを活用しやすい形にする
5-1 データ活用までに必要な準備
5-2 保存したデータを取り出す
5-3 データを整形する
5-4 データをグラフで表示する
「競合商品のデータを毎回探すのは大変」
「常にチェックしている売上ランキングをまとめおきたい」
「情報を集めるのに手間取って、じっくり分析する時間がない」
こんな情報収集の悩みは、プログラムを使えば解決できます!
多くのビジネスにおいて、自社や他社の商品情報や人気トレンド、口コミ評判などのデータ収集・分析は欠かせません。しかし、膨大なネット上の情報を手作業で集めるのは容易ではありません。データ収集に時間がかかりすぎてしまい、本来の目的である分析に時間をかけられないケースも多いでしょう。
そんなときは、データ収集をプログラムで自動化してみましょう!
本書では、プログラミング言語Python(パイソン)を使ったスクレイピングという技術で、WebページやSNSなどから自動でデータ収集する方法を学べます。初心者でも実践できるように、プログラミングやWebページのしくみの知識は必要最小限に抑え、練習用のページやサンプルのプログラムでスクレイピングを実践しながら学びます。練習用ページなどには、実際のビジネス利用シーンをイメージしやすい事例を用意しました。
プログラミングで業務を自動化・効率化したいビジネスパーソン必見の1冊です!
(こんな方におすすめ)
・データ収集の作業を効率化したいビジネスパーソン
(目次)
第1章 データ収集をハックする
1-1 プログラムを使って自動でデータを集める
1-2 自動で集められるデータとは
1-3 自動収集の注意点を押さえる
第2章 Webからデータを集める準備
2-1 データ収集に役立つPython
2-2 Pythonが使える環境を準備する
2-3 Python超入門
第3章 データ自動収集のしくみを押さえる
3-1 Webページ・WebAPIのしくみを理解する
3-2 データのフォーマットや種類を理解する
3-3 Webページからデータを取得する方法を理解する
3-4 ステップ1:HTMLをダウンロードする
3-5 ステップ2:データを抽出する
3-6 ステップ3:データを保存する
3-7 Webページから実際にデータを取得する
第4章 Pythonでデータを自動で集める
4-1 売れ筋ランキング情報を収集しよう
4-2 人気商品の画像情報を集めよう
4-3 メディアから記事情報を収集しよう
4-4 オープンデータの統計情報を収集しよう
4-5 TwitterAPIから口コミ情報を集めよう
第5章 集めたデータを活用しやすい形にする
5-1 データ活用までに必要な準備
5-2 保存したデータを取り出す
5-3 データを整形する
5-4 データをグラフで表示する
- 言語日本語
- 出版社技術評論社
- 発売日2022/1/19
- ファイルサイズ23805 KB
この本はファイルサイズが大きいため、ダウンロードに時間がかかる場合があります。Kindle端末では、この本を3G接続でダウンロードすることができませんので、Wi-Fiネットワークをご利用ください。
- 販売: Amazon Services International LLC
- Kindle 電子書籍リーダーFire タブレットKindle 無料読書アプリ
この本を読んだ購入者はこれも読んでいます
ページ 1 以下のうち 1 最初から観るページ 1 以下のうち 1
出版社より
プログラミングで情報収集を自動化!
商品の説明
出版社からのコメント
普通のPCがあれば、複雑な設定は必要なし。むずかしいコードが書けなくても、サンプルを見ながら実践的に学べます。
Web情報のチェックを自動化して、日々の仕事をもっと効率化しましょう!
Web情報のチェックを自動化して、日々の仕事をもっと効率化しましょう!
著者について
●清水義孝(しみずよしたか)
大手製造業でデータサイエンティストとして、ビックデータの分析に携わっている。その経験を活かして、データ収集・分析、BIツールに関する社内講座を担当。オンライン動画講座サイト「Udemy」で動画講座「Pythonによるビジネスに役立つWebスクレイピング」などを制作・販売中。4000名以上の受講生を持つ。
大手製造業でデータサイエンティストとして、ビックデータの分析に携わっている。その経験を活かして、データ収集・分析、BIツールに関する社内講座を担当。オンライン動画講座サイト「Udemy」で動画講座「Pythonによるビジネスに役立つWebスクレイピング」などを制作・販売中。4000名以上の受講生を持つ。
登録情報
- ASIN : B09QPJDS28
- 出版社 : 技術評論社 (2022/1/19)
- 発売日 : 2022/1/19
- 言語 : 日本語
- ファイルサイズ : 23805 KB
- Text-to-Speech(テキスト読み上げ機能) : 有効
- X-Ray : 有効にされていません
- Word Wise : 有効にされていません
- 付箋メモ : Kindle Scribeで
- 本の長さ : 359ページ
- Amazon 売れ筋ランキング: - 62,935位Kindleストア (Kindleストアの売れ筋ランキングを見る)
- - 2,389位コンピュータ・IT (Kindleストア)
- - 4,171位コンピュータ・IT (本)
- カスタマーレビュー:
著者について
著者をフォローして、新作のアップデートや改善されたおすすめを入手してください。
清水 義孝 (しみず・よしたか)
データサイエンティスト
1973年生まれ。
小学生の頃からプログラミングに興味を持ち、MSXでベーシックを習得し、ゲームの自作に夢中になる。
大学卒業後は、某大手IT企業でシステムエンジニアとして、数々のデータウェアハウス、データ分析基盤の導入に携わる。その中で、データ分析に興味を持ち始め、データ分析には、ITの知識、スキルだけでなく、ビジネスに関する深い知識やスキルが必要だと感じる。
論理・仮説思考力、統計・定量分析、プレゼンなどのスキル、ファイナンス・マーケティングなどのビジネスの知識を習得すべく、海外のビジネススクールに通いMBA(経営学修士)取得。
その後、某大手製造業でデータサイエンティストとして、ビックデータの分析に携わる。
データ分析、プログラミングに関して、初心者に役立つ情報を発信すべく、2018年よりWebサイト「Pythonで学ぶデータ分析・AI・機械学習」( https://ai-inter1.com/ )の運営を始める。
-
トップレビュー
上位レビュー、対象国: 日本
レビューのフィルタリング中に問題が発生しました。後でもう一度試してください。
2023年5月27日に日本でレビュー済み
Amazonで購入
2024年4月24日に日本でレビュー済み
Amazonで購入
内容は難しくないのですが、事例の文字が小さいのと、説明の後に事例が載っているので説明を読んでいるとどこのことなのか戸惑います。
2022年1月29日に日本でレビュー済み
Amazonで購入
こちらの本では、私のような初学者にもやさしく、PythonやHTMLの基礎から丁寧に解説されている点が好印象でした。そして基礎を簡単にひと通り理解した上で、Webスクレイピングのやり方やAPIの使い方に入ることができて理解しやすかったです。
またスクレイピングやAPIでは、実践的な場面を想定したデータ収集方法が書かれていたので、今後どのように使っていけば良いかイメージしやすく、さらにお試し用のサイトやサンプルコードも用意されていたので、データの取得を練習しながら、楽しく学習を進めることができました。
またスクレイピングやAPIでは、実践的な場面を想定したデータ収集方法が書かれていたので、今後どのように使っていけば良いかイメージしやすく、さらにお試し用のサイトやサンプルコードも用意されていたので、データの取得を練習しながら、楽しく学習を進めることができました。
2022年1月29日に日本でレビュー済み
Amazonで購入
「3-5 ステップ2:データを抽出する」で、
ダウンロードしたSampleHTML.htmlのアップロードの仕方の説明が不十分で、立ち往生。
サポートページでもう少し詳しくフォローしてください。
対応次第で星アップします。
(何とか自己解決はできましたが、私と同程度かそれ以下の方が想定読者と思われますので、やはり解凍→Jupiterアップロードの手順はサポートページでフォローしていただければと思います。あと、英語キーボードの逆スラッシュも注釈なく使われているので、初心者にはミスリードと思われます)
ダウンロードしたSampleHTML.htmlのアップロードの仕方の説明が不十分で、立ち往生。
サポートページでもう少し詳しくフォローしてください。
対応次第で星アップします。
(何とか自己解決はできましたが、私と同程度かそれ以下の方が想定読者と思われますので、やはり解凍→Jupiterアップロードの手順はサポートページでフォローしていただければと思います。あと、英語キーボードの逆スラッシュも注釈なく使われているので、初心者にはミスリードと思われます)
2022年2月13日に日本でレビュー済み
Pythonの初心者向けの本を終えて、次に何か実務で使えそうなテーマに取り組んでみたいと考え、本書を購入しました。
この手の本ではPythonの入門的な説明にページの多くが割かれ、肝心の核心部分にページがあまり割かれていないことがよくありますが、この本ではPythonの入門の内容については、「後々の章で出てくる最低限に絞り込んである」とのことでVery Goodでした。
こちらもまだ初心者ですので、Pythonの基本的な事も抜け漏れがあり、簡潔に補足することができました。
そしてWebスクレイピングやWeb APIからのデータ取得についても、HTMLやRequests、Beautiful SoupやWeb APIの使い方の基本から順を追って学べたのは、初心者でも取り組みやすかったです。
簡単な例を確認した上で、実際のWebページからのデータ取得方法に入っていけたので、非常に腹落ちしました。
完全なプログラミング初心者には難しいかもしれませんが、Pythonをある程度かじって、初めに取り組むには最適な本だと感じました。
この手の本ではPythonの入門的な説明にページの多くが割かれ、肝心の核心部分にページがあまり割かれていないことがよくありますが、この本ではPythonの入門の内容については、「後々の章で出てくる最低限に絞り込んである」とのことでVery Goodでした。
こちらもまだ初心者ですので、Pythonの基本的な事も抜け漏れがあり、簡潔に補足することができました。
そしてWebスクレイピングやWeb APIからのデータ取得についても、HTMLやRequests、Beautiful SoupやWeb APIの使い方の基本から順を追って学べたのは、初心者でも取り組みやすかったです。
簡単な例を確認した上で、実際のWebページからのデータ取得方法に入っていけたので、非常に腹落ちしました。
完全なプログラミング初心者には難しいかもしれませんが、Pythonをある程度かじって、初めに取り組むには最適な本だと感じました。
2022年3月18日に日本でレビュー済み
Pythonでのデータ収集に関する書籍は、ごく初歩的なものか、いきなり専門的なものかに 分かれていましたが、2022年頃から その中間にあたる本が出てきました。
この本も、実際のWebページからのスクレイピングを想定して、具体的なポイントが 分かりやすく書かれています。
なお、p.212で e-Statのデータを取得する際は、paramsを使うよりも、単にget(url)する方が よさそうです。
この本も、実際のWebページからのスクレイピングを想定して、具体的なポイントが 分かりやすく書かれています。
なお、p.212で e-Statのデータを取得する際は、paramsを使うよりも、単にget(url)する方が よさそうです。
2022年2月13日に日本でレビュー済み
今までにPython関連の本をいくつか購入しましたが、正直、仕事でどのように使っていけば良いかよく分かりませんでしたが、この本には具体的に仕事に使っている例が掲載されていて、この本を見ながら仕事でもデータ収集の自動化を試して行けそうです。
また本だけでは全て理解するのは難しい面もありますが、ソースコードもダウンロードすればJupyter Notebookからすぐに実行できて、結果も目で確認できたので、理解の助けになりました。(APIだけはすぐにとはいかず、実行前に事前の登録が必要でした。)
合わせて、本書用の練習サイトが用意されているのも便利で、ソースコードを変更して、いろいろ試してみることで、さらに理解することができました。
改善点としては、この本には実用的な例が5つありましたが、サクサク読み進めて行けましたので、あといくつか例が掲載されていればもっとよかったと思います。特に私が経理関係の職に就いていることもあり、経理に特化した例もあればベストでした。次回作に期待しています。
また本だけでは全て理解するのは難しい面もありますが、ソースコードもダウンロードすればJupyter Notebookからすぐに実行できて、結果も目で確認できたので、理解の助けになりました。(APIだけはすぐにとはいかず、実行前に事前の登録が必要でした。)
合わせて、本書用の練習サイトが用意されているのも便利で、ソースコードを変更して、いろいろ試してみることで、さらに理解することができました。
改善点としては、この本には実用的な例が5つありましたが、サクサク読み進めて行けましたので、あといくつか例が掲載されていればもっとよかったと思います。特に私が経理関係の職に就いていることもあり、経理に特化した例もあればベストでした。次回作に期待しています。