ショコラ
simple_html_dom のサンプルプログラム
時々スクレイピングする時にキメマス。
simple_html_dom は PHP8 で動作しました。
マニュアル
https://simplehtmldom.sourceforge.io/docs/1.9/index.html
もっさん先輩
手順
- PHPコンテナを起動します。
docker run --rm -it php bash
- apt-get アップデートします。
apt-get update
- apt-get アップデートします。
apt-get install -y unzip
- コンポーザーをインストールします。
curl -sS https://getcomposer.org/installer | php &&\
mv composer.phar /usr/local/bin/composer &&\
chmod a+x /usr/local/bin/composer
- php-simple-html-dom-parser をインストールします。
composer require kub-at/php-simple-html-dom-parser
- テストプログラムを作ってみます。
cat <<'EOF' > dom.php
<?php
require 'vendor/autoload.php';
use KubAT\PhpSimple\HtmlDomParser;
$html = '<html><title>Hello Answorz!</title><body><p>Hello mossan</p><p>Hello Chocolat</p></body></html>';
$dom = HtmlDomParser::str_get_html($html);
echo $dom->find('title')[0]->plaintext,PHP_EOL;
foreach ($dom->find('p') as $elem) {
echo $elem->plaintext,PHP_EOL;
}
EOF
- テストプログラムを実行します。
php dom.php
以上