Hace casi dos años buscaba recursos para realizar un proyecto de PLN en español y no encontré nada. Entonces creé un grupo en Slack con un par de personas que se habían topado con el mismo problema; nunca imaginé que ese grupo llegaría a convertirse en lo que es hoy Somos NLP.
👏 Gracias por estos dos años
Hemos crecido hasta ser una increíble comunidad internacional de casi 900 miembros en Discord y muchos más si contamos redes sociales. Es todo un placer dar la bienvenida cada día a más y más personas hispanohablantes estudiando, trabajando e investigando en el mundo del PLN 🤩
En 2022 organizamos elmayor hackathon open-source de NLP en español. Nos juntamos más de 500 personas de 29 países para crear bases de datos y entrenar modelos de PLN enfocados a los Objetivos de Desarrollo Sostenible. Los resultados fueron espectaculares.
Algunos de los proyectos han dado lugar a papers, como es el caso de “BiomedIA” y el “Evaluador de Legibilidad de Textos”, y otros se siguen utilizando a día de hoy, como es el caso del “Modelo Jurídico Mexicano” en la Suprema Corte de Justicia de la Nación. También se crearon bases de datos de calidad como el corpus paralelo español-náhuatl o modelos de gran impacto social como el “Neutralizador de Género” y el “Detector de Sexismo”.
Además, durante los días que se celebró el hackathon tuvimos la suerte de contar con 17 especialistas del mundo del PLN que compartieron su experiencia con la comunidad.
A finales del 2022 lanzamos un nuevo tipo de eventos:“Proyectos de la comunidad”, con el objetivo de dar visibilidad a proyectos desarrollados por miembros de Somos NLP. Los primeros protagonistas de esta serie fueron un equipo de Omdena Mexico y los equipos ganadores del hackathon que nos explicaron la motivación, retos y desarrollo de sus interesantes proyectos.
En el 2021 ya habíamos creado, con el apoyo de Spain AI, el curso“NLP de 0 a 100”, un curso open-source gratuito para comprender los conceptos y arquitecturas clave del PLN y su aplicación a casos prácticos utilizando el ecosistema de Hugging Face. ¡Las grabaciones de las sesiones ya tienen más de 20.000 visualizaciones!
Así, con estas iniciativas y las de otras organizaciones, estamos consiguiendo darle más visibilidad e importancia al PLN en nuestro idioma. Cuantifiquemos este logro: cuando creé el grupo de Slack del que surgió Somos NLP, había 259 modelos en español en el hub de Hugging Face. A día 3 de enero de 2023 hay1000 modelos. Hace menos de 2 años había 7 bases de datos monolingües en español y hoy hay64 bases de datos, 23 de las cuales fueron creadas para el hackathon.
Nos merecemos un muuuy fuerte aplauso 👏👏👏
🚀 Y en 2023, ¿qué?
En 2023 seguiremos organizando iniciativas y creando recursos para acelerar el avance del estado del arte del PLN en nuestro idioma. ¿Algunos ejemplos?
🔥 Organizaremos series de eventos con las que llevar tus conocimientos de PLN al siguiente nivel, comenzamos este mes con una serie sobreCuantización de Grandes Modelos del Lenguaje. También seguiremos con los “Proyectos de la comunidad”, un espacio para dar visibilidad a proyectos desarrollados por miembros de Somos NLP. Y… organizaremos otro hackathon para seguir impulsando la creación de bases de datos y modelos del lenguaje abiertos en nuestro idioma.
Durante estas primeras semanas del año iremos anunciando las fechas de los próximos eventos y publicando más detalles, síguenos enEventbriteyYouTube.
💻 Además, hemos creado unanueva bolsa de empleopara poner en contacto talento con empresas y grupos de investigación con ofertas de trabajo e investigación en el campo del PLN. ¿Quieres que tu oferta sea de las primeras en aparecer? Rellena esteformulario.
💡 Recuerda que creamos todos los recursos pensando en ti, en la comunidad. ¿Tienes una idea para una iniciativa? Anímate a compartirla, te leemos en RRSS, Discord y eninfo@somosnlp.org.
🙌 Aporta tu granito de arena
Somos una comunidad internacional en la que todo el mundo es bienvenido independientemente de sus conocimientos previos sobre PLN. Si te interesa este apasionante campo, únete y ayúdanos en nuestra misión de democratizar el PLN en español. ¿Cómo?
- Síguenos y da visibilidad a nuestras iniciativas, artículos y eventos enLinkedInyTwitter
- Comparte intereses y proyectos con la comunidad enDiscord
- Únete al equipo y ayúdanos a organizar eventos, crear carteles, escribir contenido, olo que mejor se te dé
- Publica un artículo o tutorial en nuestroblog
- Ayúdanos a mantener y mejorar lapágina web(por ejemplo, si sabes de Vue / Netlify agradecería ayuda para arreglar el bug que elimina los espacios antes y después de palabras en negrita y enlaces)
- Comparte tu experiencia en unacharla o taller
- Y, por supuesto, crea bases de datos y entrena modelos del lenguaje abiertos (si te atascas no te preocupes, ¡pídenos ayuda en Discord!)
¡Muchas gracias por tu apoyo!
🤗 Feliz 2023
Todo el equipo de Somos NLP te deseamos un muy feliz 2023, ¡en el que esperamos verte mucho!