カテゴリー
プライバシー

GitHub Copilot で TODO(@ を打つと誰かのToDoが表示される、かもしれない

コメント中に後でやるべき課題を ToDo の形で残す、多くのプログラマがやっている習慣かと思います。

twitter で報告されたのは、GitHub のコーディング提案機能 Copilot をオンにして TODO(@ナントカ と他ユーザーを指定したコメントを書き始めると、ユーザー名とToDoの内容が提案されるというもの。

twitter.com/aeolianeth/status/1579980661464895490

どこかの誰かのToDo がユーザー名と結びついて他のプログラマから見えたとしたら…?

そこまでたいへんなことではないかもしれません。ToDo に書いたことにそこまで機密性の高いものはないかもしれませんし。そもそもオープンにされているソースコードから収集したものでしょうし。

Hacker News の議論では、「ここに出てきたユーザー名の公開リポジトリを見てみたけれど提案されたような ToDo は見当たらなかった」と言ってる人もいます。

ろくに中身が無かったり、privateリポジトリばかりだったり、存在しないユーザー名もあったようなので、「ユーザー名の提案はランダムに生成したものが出ているだけで実際のユーザー名とは偶然衝突しているだけなのでは」、とか、「万一コメントの中に API key などがあっても、それは GitHub 全体の仕組みとして警告される(ので提案されるデータには入っていないだろう)」といった意見も出ています。

提案されているのはどこかの誰かのToDoコメントではあるのでしょうけれど、それが提案されたユーザー名とは関係ないらしい、というあたりでしょう。

学習元のデータもオープンである限りは問題ないのかな。この件は実際に問題がありそうな提案例が報告されるかどうかの続報待ちでしょうね。

via Hacker News

カテゴリー
プライバシー

観光地カメラの動画からインスタグラマーの撮影時の様子を特定する

ザ・フォロワー(The Follower)は、ベルギーのアーチストでプライバシーや人工知能などをテーマにしているドリーズ・デポーターさん(Dries Depoorter)による新プロジェクト。街中にあるウェブカメラの映像の録画を使って、その付近で撮影した写真をインスタグラムに公開しているユーザーを見つけることができる、というのを示しています。

この場所探しましたよ。アイルランド ダブリンにあるテンプルバーという有名なバーのようです。

デポーターさんが使ったのと同じものかわかりませんが、テンプルバーの前をライブ中継しているカメラもネットで見つけました。

手順は以下の通りだそう。

  1. ネットに公開されているライブカメラの画像を数週間録画しておく
  2. ライブカメラの場所でタグ付けされている Instagram の写真を全部取得
  3. 二つのデータをプログラムをまわして、同じ人物を見つける

1と2は以前からでもできたでしょうけど、画像から人物の特徴を取り出す技術が進んだことで3が簡単にできるようになった、ということがわかりますね。

プロジェクトサイトには6人のインスタグラムユーザーの実例が展示されています。また、今後見つかったものはソーシャル(Instagramなど)に上げていくということ。

Instagram に上げている人はたくさん撮って一番いいのを上げているのかもしれません。動画と突き合せれば、何分間そこにいたかとかポーズを何種類取ったとか、同行者や撮影者もわかってしまいますね。

ウェブカメラが24時間動いていて、動画がずっとインターネットに公開されているというのは限定された場所でしょう。少なくとも今は。十分なストレージとソフトウェアがあれば、知人や有名人の写真を使ってそれらの場所にその人がいつ現れたか、ということを個人が調べられるようになってきたという警鐘を、このプロジェクトは鳴らしているのだと思います。

カテゴリー
データ可視化 プライバシー

Googleと通信する度に音を鳴らすツール

berthubert/googerteller は、Googleとの通信を可視化(可聴化?)するオープンソースのツールです。

ツールは tcpdump で出力した通信先のIPアドレスを、既知の Google サーバー群の IPアドレスとパターンマッチし、オーディオライブラリのespeak-ng/pcaudiolib で音を鳴らすという仕組みで動いています。

作者の Bert Hubert さん自身が、オランダ政府サイトの求職ページを開いた時にどれだけの通信が Google との間で発生しているかを twitter で見せてくれています。

ブラウザのアドレスバーでの文字入力時の音は キーワード予測、Google検索の時の音はもちろん、ボタン上でホバーした時やページ遷移した時の音は Google Analytics でしょうか。

便利な機能を提供するために必要な通信ですし、サービス提供側や広告ネットワークからユーザーの属性を知るために集められる通信もあるでしょう。多数の通信が発生していることは多くの人が知っているでしょうけれど、その頻度が音という形に変換されると、多いなとか意外に少ないなとかは人によって異なるでしょうが、通信があるということ自体は意識させられます。

via Hacker News