Hoy descubriremos diversas técnicas y herramientas open-source integradas en el ecosistema de Hugging Face que podéis utilizar para evaluar y mitigar sesgos tanto en datasets como en modelos de PLN. También hay un mini paréntesis sobre la evaluación de la huella de carbono del entrenamiento de modelos.
María Grandury es una ingeniera e investigadora de Machine Learning especializada en las áreas del PLN y la fiabilidad de la IA. Es matemática y física y actualmente trabaja en neurocat, una startup con sede en Berlín, donde desarrolla métodos de explicabilidad (XAI) y ataques adversarios para evaluar la seguridad de modelos de ML. Además, es la fundadora de Somos NLP, una comunidad internacional cuya misión es democratizar y acelerar el avance del NLP en español. Es Hugging Face Fellow y forma parte de varios proyectos de investigación de PLN internacionales, además de colaborar activamente con diversas iniciativas de mujeres en IA.
Importante para el hackathon
Evaluar los sesgos de nuestros datasets y modelos es MUY importante y valoraremos positivamente que lo hayáis incluido en las Dataset y Model Cards de vuestros proyectos. Si tenéis cualquier duda me podéis preguntar por el Discord de Somos NLP.