作った動機
モデルが改良されたのにCopilotの体験は進化しないのでカッとなって自作した
拡張では制限が厳しい(この部分はあまり深掘りされてなかった)
Cursor Tab
エディタ上の操作とファイル情報から次の行動(コードではない!)を予測する
独自にトレーニングしている
GPUを使うといってるから外部APIコールではなく独自モデルの推論を動かしているっぽい
この予測は入力が支配的なのでキャッシュが重要
カスタムモデル
差分生成は既存のGPTやCaludeのみでは不得意なので自分たちでトレーニングしたdiff生成モデルを組み合わせてる
Tab以外に「Apply」もモデルを使っているらしい。意外
だからPro機能だったのか。ただの課金誘導かと思ったらサーバーリソース使ってた
投機的デコード
画面に表示する変更と実際のファイル編集指示のトークンは2系統ある
並列に実行して画面には変更内容を先に出す
コードレビューの体験をよくしたい
現在のコードレビューはdiffを上から下まで読んでいく
diffの中に重要な箇所とそうでない箇所があってどこの読むべきなのかをモデルがガイドできないか?
改善されたコードレビューは文章を読むように変更を確認できるようになるかも
CursorのComposerの更新を人間が読むときはすでにこの体験になっているので、他人の変更のdiffからComposerの作文相当のものを生成するというアイデアもある?
Q: ぶっちゃけどのモデルがいいの? A: Sonnet
コーディング面接のような課題のベンチマークでは成績が良いモデルでも実際の正解のない開発では機能しないことがある
Q: CursorでCursorを開発してるの? A: もちろん