あっきぃ日誌

鉄道ブログのような技術系ブログのようななにか

Twitterからダウンロードできるツイート履歴の種類が増えている?18GBのzipとは。

なぐりがき。

今まで知られていたcsvのツイート履歴は設定画面の最初のページでリクエスト・ダウンロードできますけど、なんかTwitterデータとかいうページが増えていて、こちらだとJSONとメディアデータも含まれているっぽいです。なんか増えた?

ただのCSV履歴はこっち。

https://twitter.com/settings/account

メディアとかDMとかあれこれ全部含まれてそうなやつがこっち。

https://twitter.com/settings/your_twitter_data

全部含むやつをリクエストしたら18GBのzipがふってきて、大体画像なので展開後も19GB程度になって、ブルーレイかよ……ってなってしまった。

メディアに関してはRTしたツイートのメディアを含む全データが入っている。凍結されたアカウントのツイート・メディアも含まれる点がすごい。凍ったツイッタラーのデータをサルベージできるチャンスがこんなところにあるとは。ただしこのメディアデータには問題点もあって、メディアのファイル名が全部sha256っぽい名前になっててtweet.jsと紐付いてなさそうな点。ツイートのIDとかからファイル名を生成できればいいんだけど、そう言うのに手を付けている人が見当たらない。そう言う意味でもこのデータダウンロードってそんな昔からあるものではなさそう?という気がした。

ンマそもそも凍ったツイッタラーのデータもアクセスできないだけでサーバーには残っているわけで、プライバシー的なところを考えると凍結ユーザーにもダウンロードの権利は与えられても良さそうな気がするんだよなあ。このへんうるさそうなEUあたりが罰金ちらつかせながら騒いでくれないかなー(完全に偏見)みたいなことを思う今日このごろー。

(追記)うなしがみつけてくれた。ありがとう。
mstdn.maud.io
mstdn.maud.io

(Mac) $ echo -n https://pbs.twimg.com/media/CGTqvzPUcAA2pYc.png | shasum -a 256
36762e79eba7686766e1cffae156a1657d61489a3de0b0774f7aa088bcd4e0e7  -

(Linuxとか) $ echo -n https://pbs.twimg.com/media/CGTqvzPUcAA2pYc.png | openssl dgst -sha256
(stdin)= 36762e79eba7686766e1cffae156a1657d61489a3de0b0774f7aa088bcd4e0e7

/path/to/tweet_media $ ls 36762e79eba7686766e1cffae156a1657d61489a3de0b0774f7aa088bcd4e0e7.png
36762e79eba7686766e1cffae156a1657d61489a3de0b0774f7aa088bcd4e0e7.png

(追記)EUあたりが罰金ちらつかせながら騒ぐ必要はなかったらしいな?

social.mikutter.hachune.net