Baseten
2025年10月から、Baseten という会社で働いている。本社はサンフランシスコにあって、私も入社直後に一週間だけ出張していた。その後はシアトルからリモートで働いている。
会社は、いわゆる AI スタートアップで、推論のためのインフラ (というと曖昧だけど、基本的には GPU をはじめとする計算資源) を他の企業に提供している。プログラマの人々にわかりやすいところだと、たとえば Zed の入力予測には Zeta という Qwen2.5-Coder-7B をファインチューンしたモデルが使われていて、Baseten 上のインフラ で実行されている。
Baseten 上といっても、実際の VM は色々なパブリッククラウドにある。ここは前職の Fly.io とはちがうところ。AI 特需からくる GPU 不足にマルチクラウドで立ち向かうのは、2025年らしさがあるし、前々職の AWS をはじめとするパブリッククラウド自体で働いていたら「無い」展開で良いなと思う。