Des chercheurs ont développé un nouveau système d'évaluation appelé Hist-LLM. Il permet de tester les trois principaux modèles de langage (LLM) : GPT-4 (OpenAI), Llama (Meta) et Gemini (Google). L’étude évalue l’exactitude des réponses en se basant sur le Seshat Global History Databank, base de données sur l’histoire nommée d’après la déesse égyptien...