Hugging Face lanza un clon gratuito de ChatGPT: HuggingChat
abrazando la cara
Hugging Face es un negocio y una comunidad de IA. Brinda acceso a herramientas gratuitas de código abierto para desarrollar aplicaciones de inteligencia artificial y aprendizaje automático.
Uno de los proyectos recientemente completados de Hugging Face es un gran modelo de lenguaje de 176 mil millones de parámetros llamado Bloom, que está disponible para cualquier persona que acepte cumplir con su licencia de IA responsable.
Hay acceso a modelos de código abierto en varias categorías, como multimodal, visión, audio, procesamiento de lenguaje natural y aprendizaje de refuerzo.
Hugging Face también aloja conjuntos de datos y bibliotecas de código abierto y permite que los equipos colaboren, incluido un repositorio, similar a GitHub.
Muchos servicios están disponibles para los niveles gratuitos, profesionales y empresariales.
abrazandogato
El clon de HuggingChat ChatGPT se basa en el modelo de IA conversacional de Open Assistant.
Open Assistant en sí es un proyecto de la Red Abierta de Inteligencia Artificial a Gran Escala (LAION, por sus siglas en inglés) sin fines de lucro.
LAION es una organización global sin fines de lucro dedicada a proporcionar acceso a tecnología de punta como fuente abierta.
Escriben:
«NUESTRA CREENCIA
Creemos que la investigación del aprendizaje automático y sus aplicaciones tienen el potencial de tener un gran impacto positivo en nuestro mundo y, por lo tanto, deben democratizarse.NUESTROS PRINCIPALES OBJETIVOS
Publique conjuntos de datos abiertos, códigos y modelos de aprendizaje automático.Queremos enseñar los conceptos básicos de la investigación de ML a gran escala y la gestión de datos.
Al hacer que los modelos, los conjuntos de datos y el código sean reutilizables sin la necesidad de entrenar desde cero todo el tiempo, queremos promover el uso eficiente de la energía y los recursos informáticos para enfrentar los desafíos del cambio climático. .
La página de GitHub de la plantilla de chat de Open Assistant dice:
«Open Assistant es un proyecto para brindar a todos acceso a un gran modelo de lenguaje basado en chat.
Creemos que al hacer esto, crearemos una revolución en la innovación lingüística.
De la misma manera que Stable Streaming ha ayudado al mundo a crear arte e imágenes de nuevas formas, esperamos que Open Assistant pueda ayudar a mejorar el mundo mejorando el lenguaje mismo.
Conjunto de datos de entrenamiento de HuggingChat
HuggingChat se entrenó con el conjunto de datos OpenAssistant Conversations (OASST1), que es muy nuevo y contiene datos recopilados hasta el 12 de abril de 2023.
El documento de investigación para el conjunto de datos está fechado en abril de 2023 (Conversaciones de OpenAssistant: democratización de la alineación del modelo de lenguaje grande – PDF).
Este modelo utiliza la misma metodología de entrenamiento creada por OpenAI que se llama aprendizaje reforzado a partir de la retroalimentación humana (RLHF).
RLHF es una técnica para crear un conjunto de datos de preguntas y respuestas anotados por humanos de alta calidad que se pueden usar para entrenar a una IA para que siga instrucciones.
Con este lanzamiento han conseguido su objetivo de poner la técnica RLHF al alcance de cualquiera que quiera entrenar una IA.
El trabajo de investigación decía:
«En un esfuerzo por democratizar la investigación de alineamiento a escala, estamos lanzando OpenAssistant Conversations, un corpus de conversación de estilo asistente generado por humanos y anotado que consta de 161 443 mensajes en 66 497 árboles de conversación, en 35 idiomas diferentes, anotados con 461 292 mensajes de calidad. impares. »
El conjunto de datos es el producto de un esfuerzo global de crowdsourcing de más de 13,000 voluntarios.
El crowdsourcing fue una buena manera de generar datos de capacitación multilingües que contribuyeron a un conjunto de datos de alta calidad.
Sin embargo, según los investigadores, el enfoque de crowdsourcing también introdujo limitaciones en la calidad del conjunto de datos en forma de sesgos culturales y subjetivos de las personas que crearon y evaluaron los datos de entrenamiento.
También advirtieron que los participantes más comprometidos tendían a contribuir más, creando una distribución desigual de sus valores y sesgos.
Los investigadores concluyen que el conjunto de datos puede no representar la diversidad de puntos de vista de todos los contribuyentes.
Por ejemplo, enviaron una encuesta a su canal de Discord (solo en inglés) haciendo preguntas a sus colaboradores de código abierto relacionadas con su demografía (pero no con su origen étnico).
Dejando a un lado el sesgo de idioma, los resultados de la encuesta revelaron que de los 226 encuestados, 201 eran hombres, 10 eran mujeres, cinco se identificaron como no binarios/otros y 10 se negaron a responder.
No obstante, aunque no garantizan al 100% que el conjunto de datos esté libre de contenido dañino, aún lo respaldan, ya que se creó con estrictas pautas de calidad.
Los investigadores escriben:
“Para garantizar la calidad de nuestro conjunto de datos, hemos establecido pautas estrictas para los colaboradores que todos los usuarios deben seguir.
Estas pautas están diseñadas para evitar la adición de contenido dañino a nuestro conjunto de datos y alentar a los contribuyentes a generar respuestas de alta calidad.
HuggingChat está disponible
HuggingChat está abierto a los usuarios en este momento. No es necesario registrarse para crear una cuenta de inicio de sesión para usarla.
No espere el nivel de lanzamiento de ChatGPT, el servicio aún no está en ese nivel. La página de la aplicación lo enumera como versión 0.0, lo que debería dar una idea de su madurez en este momento.
Sin embargo, es un logro notable y un primer paso para la comunidad de código abierto y su uso es absolutamente gratuito.
Visite la página web de HuggingChat aquí:
Página web e interfaz de usuario de HuggingChat
La entrada Hugging Face lanza un clon gratuito de ChatGPT: HuggingChat se publicó primero en Seo Con SEM.
source https://seoconsem.es/2023/04/27/hugging-face-lanza-un-clon-gratuito-de-chatgpt-huggingchat/
Comentarios
Publicar un comentario