なぐりがき。
今まで知られていたcsvのツイート履歴は設定画面の最初のページでリクエスト・ダウンロードできますけど、なんかTwitterデータとかいうページが増えていて、こちらだとJSONとメディアデータも含まれているっぽいです。なんか増えた?
ただのCSV履歴はこっち。
https://twitter.com/settings/account
メディアとかDMとかあれこれ全部含まれてそうなやつがこっち。
https://twitter.com/settings/your_twitter_data
全部含むやつをリクエストしたら18GBのzipがふってきて、大体画像なので展開後も19GB程度になって、ブルーレイかよ……ってなってしまった。
メディアに関してはRTしたツイートのメディアを含む全データが入っている。凍結されたアカウントのツイート・メディアも含まれる点がすごい。凍ったツイッタラーのデータをサルベージできるチャンスがこんなところにあるとは。ただしこのメディアデータには問題点もあって、メディアのファイル名が全部sha256っぽい名前になっててtweet.jsと紐付いてなさそうな点。ツイートのIDとかからファイル名を生成できればいいんだけど、そう言うのに手を付けている人が見当たらない。そう言う意味でもこのデータダウンロードってそんな昔からあるものではなさそう?という気がした。
ンマそもそも凍ったツイッタラーのデータもアクセスできないだけでサーバーには残っているわけで、プライバシー的なところを考えると凍結ユーザーにもダウンロードの権利は与えられても良さそうな気がするんだよなあ。このへんうるさそうなEUあたりが罰金ちらつかせながら騒いでくれないかなー(完全に偏見)みたいなことを思う今日このごろー。
(追記)うなしがみつけてくれた。ありがとう。
mstdn.maud.io
mstdn.maud.io
(Mac) $ echo -n https://pbs.twimg.com/media/CGTqvzPUcAA2pYc.png | shasum -a 256 36762e79eba7686766e1cffae156a1657d61489a3de0b0774f7aa088bcd4e0e7 - (Linuxとか) $ echo -n https://pbs.twimg.com/media/CGTqvzPUcAA2pYc.png | openssl dgst -sha256 (stdin)= 36762e79eba7686766e1cffae156a1657d61489a3de0b0774f7aa088bcd4e0e7 /path/to/tweet_media $ ls 36762e79eba7686766e1cffae156a1657d61489a3de0b0774f7aa088bcd4e0e7.png 36762e79eba7686766e1cffae156a1657d61489a3de0b0774f7aa088bcd4e0e7.png