概要とサンプルコード
Twitterのデータをスクレイピングするには、Twitter APIを利用する方法や、Webスクレイピングを行う方法があります。
Twitter APIを利用するには、Twitter Developerでアプリを登録し、アクセストークンを取得する必要があります。
アクセストークンを取得したら、PythonでTwitter APIを叩くためのライブラリをインストールします。
ただし、Twitter APIを利用するには、API利用規約に同意する必要がありますので、ご注意ください。
PythonでTwitter APIを叩くためのライブラリとしては、tweepyがよく使われます。tweepyを使うには、pipでインストールします。
pip install tweepy 次に、tweepyを使って、Twitter APIを叩いてデータを取得します。 import tweepy # Twitter APIの認証情報を設定する consumer_key = 'YOUR_CONSUMER_KEY' consumer_secret = 'YOUR_CONSUMER_SECRET' access_token = 'YOUR_ACCESS_TOKEN' access_token_secret = 'YOUR_ACCESS_TOKEN_SECRET' auth = tweepy.OAuth1UserHandler( consumer_key, consumer_secret, access_token, access_token_secret ) # Twitter APIクライアントを作成する api = tweepy.API(auth) # ユーザーのタイムラインを取得する timeline = api.user_timeline(screen_name='twitter_username') # タイムラインを表示する for tweet in timeline: print(tweet.text)
上のコードでは、tweepyのAPIクライアントを作成し、user_timeline()メソッドを使って、指定したユーザーのタイムラインを取得しています。
取得したタイムラインは、tweepyのStatusオブジェクトのリストとして返されるので、for文を使って、それぞれのStatusオブジェクトを取り出し、textプロパティを表示しています。
コメント