Chcete-li použít data z Wikipedie bez softwaru MediaWiki, budete si muset vytvořit parser. Pokud se v mnoha článcích vyskytuje špatná syntax, naprogramování takového parseru je složitější, jelikož musí umět tyto chyby rozpoznávat.
Tento projekt pomáhá hledat chyby různého druhu v různých jazycích. Do budoucna jich bude podporovat více.
Jak to funguje?
Skript denně vytváří na Toolforge novou stránku s chybami.
Skript prochází každý nový databázový dump a vytváří seznam článků s chybami.
Skript prochází denně všechny články v seznamu a vytváří nový, v němž již nejsou uvedeny opravené chyby.
Skript byl napsán v jazyce Perl a jeho autorem je Stefan Kühn.
Můžete si jej stáhnout zde. Je uvolněn pod licencí GPLv3.