
SWE-bench & SWE-agent | Data Brew | Episode 44
Falha ao colocar no Carrinho.
Tente novamente mais tarde
Falha ao adicionar à Lista de Desejos.
Tente novamente mais tarde
Falha ao remover da Lista de Desejos
Tente novamente mais tarde
Falha ao adicionar à Biblioteca
Tente outra vez
Falha ao seguir podcast
Tente outra vez
Falha ao parar de seguir podcast
Tente outra vez
-
Narrado por:
-
De:
Sobre este áudio
In this episode, Kilian Lieret, Research Software Engineer, and Carlos Jimenez, Computer Science PhD Candidate at Princeton University, discuss SWE-bench and SWE-agent, two groundbreaking tools for evaluating and enhancing AI in software engineering.
Highlights include:
- SWE-bench: A benchmark for assessing AI models on real-world coding tasks.
- Addressing data leakage concerns in GitHub-sourced benchmarks.
- SWE-agent: An AI-driven system for navigating and solving coding challenges.
- Overcoming agent limitations, such as getting stuck in loops.
- The future of AI-powered code reviews and automation in software engineering.
Ainda não há avaliações