- openai a paradigm představily evmbench, aby posoudily schopnost ai systémů zvládat zranitelnosti chytrých kontraktů na ethereu.
- benchmark využívá 120 skutečných problémů z auditu a hodnotí detekci, opravy a možnosti exploitace v kontrolovaných prostředích.
- počáteční výsledky ukazují významné rozdíly ve výkonu mezi gpt-5.3-codex a gpt-5, což zdůrazňuje rychlý pokrok modelu.
openai nedávno odhalila evmbench, benchmark pro bezpečnost chytrých kontraktů vyvinutý ve spolupráci s investiční firmou paradigm. Tento rámec má za cíl zjistit, zda mohou systémy umělé inteligence detekovat, využívat a opravovat závažné chyby v chytrých kontraktech na ethereu.
díky tomu, že jsou chytré kontrakty obecně neměnitelné po nasazení, mohou mít chyby trvalé finanční důsledky. openai uvedla, že tyto smlouvy obvykle chrání více než 100 miliard USD (141 miliard AUD) v otevřených kryptoměnách, což zvyšuje důležitost přísného hodnocení bezpečnosti s rostoucími schopnostmi kódování ai.
související: stripe-owned bridge získává podmíněné schválení occ pro vznik národní kryptobanky
hodnocení výkonnosti ai
sada dat tvořící základ evmbench se skládá ze 120 pečlivě vybraných zranitelností pocházejících ze čtyřiceti profesionálních auditů; většina byla získána z otevřených auditních soutěží jako code4rena.další scénáře pochází ze zabezpečovacích auditních prací pro tempo – blockchain navržený tak, aby podporoval platby stablecoin s vysokým průtokem a nízkými náklady.
systémy umělé inteligence jsou hodnoceny ve třech kategoriích: detekce známých zranitelností, oprava smluv bez ohrožení zamýšlené funkčnosti a provádění pokusů o exploitaci v kontrolovaném blockchainovém prostředí. úkoly exploitu jsou hodnoceny pomocí deterministického opakování transakcí a on-chain kontrol.
ve výsledcích benchmarku dosáhl gpt-5.3-codex skóre 72.2 % v režimu exploitu; zatímco gpt-5 zaznamenal pouze31.9 %, přestože byl vydán jen o něco více než před šesti měsíci. openai uvedla jako cíl vytvořit jasný standard pro hodnocení systémů umělé inteligence v oblasti zabezpečení blockchainu s tím jak se decentralizované finance stále rozvíjejí.
související: ledger integruje okx dex pro umožnění vícetransakčních výměn tokenů přímo v aplikaci