BeautifulSoupでidを指定して要素を取得する方法：findとselectの使い分け

2026年5月3日

要素取得

Webスクレイピングは、現代のデータ活用において欠かせない技術となりました。

特にPythonのBeautiful Soupライブラリは、その直感的な操作性と強力な解析能力により、多くのエンジニアやデータサイエンティストに愛用されています。

HTMLドキュメントから特定の情報を抽出する際、最も確実で効率的な方法の一つがID（アイデンティティ）を指定して要素を取得することです。

HTMLの仕様上、IDはページ内で一意（ユニーク）であるべきものとされているため、クラス指定などと比較しても目的のデータに最短距離でアクセスできます。

本記事では、Beautiful Soupを使用してID指定で要素を取得する具体的な手法について、findメソッドとselectメソッド（CSSセレクタ）の使い分けを中心に詳しく解説します。

2026年現在のベストプラクティスを取り入れ、効率的かつメンテナンス性の高いコードを書くためのポイントを整理していきましょう。

目次 [ close ]

Beautiful SoupにおけるID指定の重要性

HTML構造の中から特定のデータを取り出す際、私たちはタグ名、クラス名、属性、テキスト内容など、さまざまな手がかりを利用します。

その中でもID属性は最強の目印といえます。

なぜなら、HTMLの標準規格において「同じIDは一つの文書内に二つ以上存在してはならない」と定められているからです。

クラス名（class）が複数の要素で共有され、デザインやグループ化のために使われるのに対し、IDは特定のパーツ（例えばメインコンテンツ、サイドバー、フッターなど）を特定するために付与されます。

スクレイピングのコードを書く際、IDをターゲットにすることで、プログラムの堅牢性が大幅に向上します。

構造が少し変わってもIDが変わらなければ、コードを修正することなくデータを取得し続けることができるためです。

findメソッドを使用したID指定の取得

Beautiful Soupで最も一般的、かつ直感的な方法がfind()メソッドを使用する方法です。

このメソッドは、条件に合致する要素のうち、最初に見つかったもの（ID指定の場合は通常一つだけ）を返します。

find(id=”…”)による直接指定

最もシンプルな書き方は、引数にidを直接渡す方法です。

Python

from bs4 import BeautifulSoup

# サンプルHTML
html_doc = """
<html>
    <body>
        <div id="header">サイトタイトル</div>
        <div id="main-content">
            <h1 id="title">Pythonスクレイピング入門</h1>
            <p>IDを使って要素を特定する方法を学びましょう。</p>
        </div>
        <div id="footer">Copyright 2026</div>
    </body>
</html>
"""

# BeautifulSoupオブジェクトの作成
soup = BeautifulSoup(html_doc, 'html.parser')

# IDを指定して要素を取得
main_content = soup.find(id="main-content")

# 結果の表示
print(f"取得した要素: {main_content}")
print(f"テキスト部分: {main_content.get_text().strip()}")

実行結果

取得した要素: <div id="main-content">
<h1 id="title">Pythonスクレイピング入門</h1>
<p>IDを使って要素を特定する方法を学びましょう。</p>
</div>
テキスト部分: Pythonスクレイピング入門
IDを使って要素を特定する方法を学びましょう。

この方法の利点は、コードが非常に読みやすい点にあります。

ひと目で「IDがmain-contentのものを探している」ことがわかります。

attrs引数を使用した指定

もう一つの書き方として、attrs引数に辞書形式で指定する方法があります。

Python

# 辞書形式での指定
element = soup.find(attrs={"id": "title"})
print(element.text)

実行結果

Pythonスクレイピング入門

この書き方は、ID以外にも複数の属性（例えば data-custom="value" など）を組み合わせて検索したい場合に非常に便利です。

また、属性名を動的に変数で渡したい場合にも適しています。

CSSセレクタ（select）を使用したID指定の取得

Beautiful Soupには、CSSの記述形式で要素を指定できるselect()およびselect_one()メソッドが用意されています。

Webフロントエンドの開発経験がある方にとっては、こちらの方が馴染み深いかもしれません。

select_one(“#id”)による取得

IDを指定する場合、CSSセレクタでは#（シャープ）記号を使用します。

Python

# CSSセレクタを使用して一つの要素を取得
# select_oneは最初に見つかった一つの要素を返す
title_element = soup.select_one("#title")

print(f"取得した要素: {title_element.text}")

実行結果

取得した要素: Pythonスクレイピング入門

select_one()は、find()と同様に「単一の要素」または「None」を返します。

一方で、select()を使うと、リスト形式で結果が返されるため、ID指定の場合は通常select_one()を利用するのが適切です。

複雑な階層構造での指定

CSSセレクタの真価は、階層構造を簡潔に表現できる点にあります。

Python

# main-contentの中にあるh1タグを、ID経由で指定
complex_target = soup.select_one("#main-content > h1")
print(complex_target.text)

このように、特定の親要素（ID）の直下にある要素を指定するといった記述が、find()を複数回繋げるよりも遥かにスッキリと記述できます。

find と select の使い分け：どちらを使うべきか？

多くの初心者が悩むのが、「findとselectのどちらを使うべきか」という点です。

2026年現在の開発現場での基準を整理しましょう。

比較項目	find / find_all	select / select_one
記述の直感性	非常に高い（Python的）	高い（CSS/フロントエンド的）
複雑な条件	複数の引数が必要で冗長になりがち	階層構造などを一行で記述可能
実行速度	わずかに速い	わずかに遅い（解析コスト）
汎用性	基本的な抽出に最適	複雑なスクレイピングに最適

findを選択すべきケース

単純に一つのIDを狙い撃ちする場合。
実行速度を極限まで追求する場合（大量のドキュメントをループで処理する場合など）。
プログラム中で属性名を辞書として管理している場合。

selectを選択すべきケース

HTMLの構造（親子関係、隣接関係）を条件に含めたい場合。
JavaScript（jQuery）やCSSの知識があり、セレクタ記法に慣れている場合。
複数の条件を組み合わせて要素を絞り込みたい場合。

実務においては、基本は「find」を使い、階層が深かったり条件が複雑になったりした際に「select」へ切り替えるというスタンスが最も効率的です。

実践的なエラーハンドリング

スクレイピングにおいて、指定したIDが存在しないケースは珍しくありません。

サイトの仕様変更や、特定の条件下でしか表示されない要素などがあるためです。

要素が見つからなかった場合、Beautiful SoupはNoneを返します。

これに対してそのまま.textやget_text()を呼び出すと、AttributeErrorが発生してプログラムが停止してしまいます。

安全な要素取得のパターン

Python

target_id = "non-existent-id"
element = soup.find(id=target_id)

# 安全なチェック方法
if element:
    print(element.text)
else:
    print(f"警告: ID '{target_id}' は見つかりませんでした。")

このように、if文による存在確認を挟むのが鉄則です。

または、Python 3.8以降で導入されたセイウチ演算子（:=）を使ってスマートに書くこともできます。

Python

if (element := soup.find(id="main-content")):
    print(element.text)

ID指定でよくある落とし穴と注意点

1. 同一IDが複数存在する場合の挙動

HTMLのルールに反して、一つのページに同じIDが複数使われている不適切なWebサイトも存在します。

find() や select_one() は、最初に見つかった要素だけを返します。
すべて取得したい場合は、例外的に find_all(id="...") を使用する必要があります。

2. 動的なIDへの対応

近年のWebフレームワーク（ReactやVueなど）で構築されたサイトでは、IDが id="jsc_c_123" のように、実行のたびに変わる「動的なID」が使われることがあります。

この場合、完全一致でのID指定は機能しません。

対策として、正規表現を使用した部分一致検索が有効です。

Python

import re

# "jsc_c_" で始まるIDを持つ要素を取得
dynamic_element = soup.find(id=re.compile(r"^jsc_c_"))

3. IDとクラスの混同

初心者がよくやるミスとして、IDを指定すべきところにクラス名を指定したり、その逆を行ったりすることがあります。

ID: id="header" -> find(id="header") または select\_one("#header")
Class: class="item" -> find(class\_="item") または select\_one(".item")

Beautiful Soupの find では、Pythonの予約語である class との衝突を避けるため、引数名が class_（アンダースコア付き）になっている点に注意してください。

まとめ

Beautiful Soupを用いたID指定による要素取得は、Webスクレイピングの基本でありながら、最も強力な武器の一つです。

find(id=”…”) は、シンプルで読みやすく、単一要素の取得に最適です。
select_one(“#…”) は、CSSセレクタの表現力を活かした柔軟な指定が可能です。
取得した要素が None である可能性を常に考慮し、エラーハンドリングを徹底しましょう。
動的なIDに対しては、正規表現を組み合わせることで柔軟に対応できます。

2026年のWebサイトはますます複雑化していますが、HTMLの基本構造を理解し、適切なメソッドを使い分けることで、目的のデータを正確に、そして安定して抽出することができます。

まずは身近なサイトの構造を解析し、findとselectの違いを実際にコードを動かしながら体感してみてください。