Hola,

I'm María Grandury!
My latest projects are

Hackathon of NLP in Spanish

NLP
Somos NLP
With more than 500 participants from 39 countries, it is the largest open-source hackathon of NLP in Spanish. The recorded events have already more than 5k visualizations! Organized by Somos NLP and sponsored by Hugging Face, Platzi and Paperspace.

BERTIN & Perplexity Sampling

NLP
Hugging Face
BERTIN Project
BERTIN is a series of RoBERTa-based models in Spanish trained using a novel sampling technique that we call "perplexity sampling". More detailed info can be found in the model card and the paper BERTIN: Efficient Pre-Training of a Spanish Language Model using Perplexity Sampling.

BigScience, ROOTS & BLOOM

NLP
Hugging Face
Research
A one-year long international research workshop on large multilingual models and datasets. We created, among other cool things, ROOTS: A 1.6TB Composite Multilingual Dataset that was then used to train BLOOM: A 176B-Parameter Open-Access Multilingual Language Model.
I was invited to speak at

El estado del arte de la industria de PLN en nuestro país y fuera

Primer foro del PERTE de la Nueva Economía de la Lengua
NLP
SOTA NLP
Round Table
El estado del arte de la industria de PLN en nuestro país y fuera
El PERTE de la Nueva economía de la Lengua es una oportunidad para aprovechar el potencial del español y de las lenguas cooficiales como factor de crecimiento económico y competitividad internacional en áreas como la inteligencia artificial, la traducción, el aprendizaje, la divulgación cultural, la producción audiovisual, la investigación y la ciencia.

1. ¿Cómo se puede avanzar el estado del arte del NLP en español?
2. ¿Cuál crees que sería el proyecto más importante a nivel internacional que deberíamos implementar?