Lo cap de projècte Plataforma lexicala e toponimica occitana establiguèt a la fin de 2023 un còrpus de trabalh, amb una lista d'òbras de referéncia cobrissent la diversitat de la lenga occitana. D'unes obratges èran ja presents dins lo còrpus del Congrès, d'autres disponibles en linha (dont d'unes dins las basas BaTelOc e dicodòc), fòrça jos dreches e/o non numerizats. Es aital qu'un primièr còrpus de mai o mens un milièr de referéncias foguèt constituït ; pasmens, nos sèm trobats confrontats al problèma d'eterogeneïtat dels formats (tèxt, xml, pdf e fichièrs imatges), aital coma a una manca de foncionalitats permetent la recèrca de mots en contèxt. Foguèt donc decidit de desvolopar una interfàcia ad hoc, lo Cercador (lo « cercaire » en occitan) amb lo supòrt d'un prestatari extèrn. Se parla d'una plataforma intèrna al Congrès, en consequéncia amb un accès reservat, permetent en partir d'un sol motor de recèrca d'identificar las ocurréncias lexicalas dins un còrpus numerizat multiformats e facilitant la contextualizacion dels mots estudiats segon lors diferentas accepcions.
S'agís d'un esplech indispensable a la vocacion descriptiva e illustrativa del diccionari. Permet de far de recèrcas avançadas, permetent l'usatge d'expressions regularas (« comença per », « conten », etc.) en utilizant de filtres (tip de còrpus, autors, genres, varianta, editor).
Foguèt engatjat un trabalh d'alargament e d'aprigondiment del còrpus. L'accent es estat mes sus l'integracion d'autors màgers de la literatura occitana qu'èran pas o pas pro representats dins la primièra version del còrpus, especificament los del periòde 1950-2020. En parallèl, pertocant las ressorsas extèrnas, foguèt tanben decidit d'obrir la foncion d'illustracion a de periodics de referéncia en linha (Jornalet, Sapiéncia, Lo Diari,…), amb la tòca de contextualizar los mots mai modèrns o relevant d'una terminologia particulara, per exemple socio-politica o scientifica.