Linux

52a03517 anonymous 2023-02-07 21:11: ChatGPTが自動バグ修正の精度がどれくらいかを検証した人がいるようだ.
APR(自動プログラム修正）やCodex CoCoNUtとChatGPTの4つの異なる
システムで40個のバグのあるコード(QuixBugsベンチマーク)を与えて

1 does this program have a bug? How to
2 fix it?
3
4 def bitcount(n):
5     count = 0
6     while n:
7       n ^= n - 1
8       count += 1
9     return count

とやった結果,ChatGPTはヒントなしに40問中19問の問題を解決し
Codexは21問,CoCoNutは19問,標準のAPRアプローチは7問を解決した.
ChatGPTはCodexやCoCoNutと同等の性能を示し,標準のAPRアプローチより
顕著に優れた結果を示した.

(Linux/299/0.7MB)