「クローリングハック」という本を共著しました
クローリングハック あらゆるWebサイトをクロールするための実践テクニック
- 作者: 竹添直樹,島本多可子,田所駿佑,萩野貴拓,川上桃子
- 出版社/メーカー: 翔泳社
- 発売日: 2017/09/14
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
前チームの上司である@takezoenさんや@chibochibo03さんや同僚といっしょに書いた「クローリングハック あらゆるWebサイトをクロールするための実践テクニック」という本が、明日14日に翔泳社さんから発売されます。
僕は3章の「文字化けと戦う」と他の章のコラムをちょこちょこ書いたりしました。
ありがたいことにamazonの「Webプログラミング」カテゴリの1位にもなったみたいです🙏
この本では、クローラーの仕組みやHTTPについてなどの基礎から、文字化けを防ぐテクニックやスクレイピングの肝、認証が必要なサイトやSPAのクローリング、大規模なサイトを効率的にクロールするテクニック、謎挙動サイトにどう対応するかなど、そこそこ以上の規模の実用的なクローラーを作る上でおさえておきたいポイントについて解説しています。
クローラーの開発に携わる方はもちろん、HTTPやHTMLなどWebの仕組みを深く知りたいWeb制作者の方にとっても役立つ内容になったのではないかなと思います。
また書籍をご購入いただいた方は翔泳社さんのサイトから応募していただくと、curlのオプションをまとめた「curlの極意」という特典PDF(12p)が受け取れますのでぜひどうぞ(^q^)