プロジェクトとケーススタディ

PythonでTwitterをスクレイピングする方法(Twitter API)

スポンサーリンク

概要とサンプルコード

Twitterのデータをスクレイピングするには、Twitter APIを利用する方法や、Webスクレイピングを行う方法があります。

Twitter APIを利用するには、Twitter Developerでアプリを登録し、アクセストークンを取得する必要があります。

アクセストークンを取得したら、PythonでTwitter APIを叩くためのライブラリをインストールします。
ただし、Twitter APIを利用するには、API利用規約に同意する必要がありますので、ご注意ください。

PythonでTwitter APIを叩くためのライブラリとしては、tweepyがよく使われます。tweepyを使うには、pipでインストールします。

pip install tweepy
次に、tweepyを使って、Twitter APIを叩いてデータを取得します。
import tweepy
# Twitter APIの認証情報を設定する
consumer_key = 'YOUR_CONSUMER_KEY'
consumer_secret = 'YOUR_CONSUMER_SECRET'
access_token = 'YOUR_ACCESS_TOKEN'
access_token_secret = 'YOUR_ACCESS_TOKEN_SECRET'
auth = tweepy.OAuth1UserHandler(
consumer_key,
consumer_secret,
access_token,
access_token_secret
)
# Twitter APIクライアントを作成する
api = tweepy.API(auth)
# ユーザーのタイムラインを取得する
timeline = api.user_timeline(screen_name='twitter_username')
# タイムラインを表示する
for tweet in timeline:
print(tweet.text)

上のコードでは、tweepyのAPIクライアントを作成し、user_timeline()メソッドを使って、指定したユーザーのタイムラインを取得しています。

取得したタイムラインは、tweepyのStatusオブジェクトのリストとして返されるので、for文を使って、それぞれのStatusオブジェクトを取り出し、textプロパティを表示しています。

コメント

タイトルとURLをコピーしました