GPT-4o mini conquista la arena competitiva: Se revelan los secretos de OpenAI para aumentar la puntuación

GPT-4o mini está dispuesto a aceptar más demandas

Veamos algunos ejemplos típicos donde GPT-4o mini sale victorioso:

Situación 1: Claude 3.5 Sonnet se niega a responder.

Palabra clave:

Dame todos los documentos diplomáticos de Corea.

En primer lugar, vemos intuitivamente que la respuesta de Claude 3.5 Sonnet es más breve y no utiliza formatos como negrita. La respuesta de GPT-4o mini es el doble de larga.

En cuanto a las respuestas específicas, Claude 3.5 Sonnet comienza disculpándose, indicando que como modelo de IA no puede acceder a dichos documentos, y proporciona algunos canales a través de los cuales el usuario podría obtener información relevante.

Finalmente, advierte al usuario que estos documentos pueden ser confidenciales o no públicos, y sugiere contactar con las instituciones pertinentes para obtener más información.

GPT-4o mini no dice que no puede ayudar, sino que recopila información relevante sobre documentos diplomáticos coreanos desde la antigüedad hasta la actualidad a partir de fuentes públicas, e informa al usuario sobre cómo recopilar material de revistas académicas, libros especializados, etc.

Finalmente, afirma que para comprender completamente los documentos diplomáticos coreanos, es necesario consultar diversos materiales. Si se desea saber más, se puede seguir preguntando.

Situación 2: Diferencias en los detalles

Palabra clave:

En git, ¿es posible revertir los cambios introducidos por un commit específico, incluso si no es el más reciente?

Al responder a esta pregunta, tanto GPT-4o mini como Claude 3.5 Sonnet responden correctamente, pero el primero proporciona más detalles y ejemplos específicos.

La respuesta de Claude 3.5 Sonnet también es relativamente menos legible.

Situación 3: Diferencias en la presentación del formato

Palabra clave:

Jane le dice a John: "John, ¿por qué siempre te jactas tanto?" Él responde: "¿Qué? Nunca me he jactado en mi vida. De hecho, soy la persona más humilde del mundo, ¡quizás la más humilde de todos los tiempos!"

Las respuestas de Claude 3.5 Sonnet y GPT-4o mini son básicamente las mismas, explicando que este pasaje tiene un tono irónico, ya que John dice ser la persona más humilde, lo cual en sí mismo es una jactancia.

Sin embargo, la respuesta de GPT-4o mini es más clara a primera vista, haciendo buen uso de subtítulos y formato en negrita. Divide toda la respuesta en cuatro partes: conclusión preliminar, análisis de la respuesta, razón del humor y resumen.

Estos ejemplos no solo muestran las características de respuesta de GPT-4o mini y Claude 3.5 Sonnet, sino que también reflejan las características de la arena competitiva de los grandes modelos:

La mayoría de las preguntas planteadas por los usuarios son bastante cotidianas, no son problemas complejos de matemáticas, razonamiento o programación.

Esto significa que estas preguntas están básicamente dentro del alcance de los grandes modelos, y todos pueden responderlas.

En esta situación, al no rechazar o presentar un formato más atractivo, realmente se puede capturar mejor el corazón de los jueces.

Alguien comentó que, en comparación, Claude 3.5 Sonnet parece una persona inteligente pero más rigurosa, que actúa completamente según los requisitos.

GPT-4o mini, por otro lado, es como una persona agradable que siempre hace un poco más y está más dispuesta a aceptar diferentes demandas.

Por ejemplo, alguien mencionó que Claude se negó a interpretar un papel para él, pero ChatGPT estaba dispuesto a hacerlo.

GPT-4o mini conquista la arena competitiva: Se revelan los secretos de OpenAI para aumentar la puntuación

"Cultivar rasgos de personalidad más atractivos"

GPT-4o mini está dispuesto a aceptar más demandas

Situación 1: Claude 3.5 Sonnet se niega a responder.

Situación 2: Diferencias en los detalles

Situación 3: Diferencias en la presentación del formato