Nuevos modelos de negocio detrás de la lucha por la potencia computacional
La fiebre de "refinar el elixir" de los grandes modelos pasará, pero la Potencia computacional se está convirtiendo en un nuevo modelo de negocio. Los proveedores de servicios de Potencia computacional necesitan prepararse con anticipación y cambiar a tiempo.
Recientemente, investigadores utilizaron datos meteorológicos de 40 años a nivel global y preentrenaron un modelo meteorológico de gran escala con 200 tarjetas GPU en aproximadamente 2 meses, logrando un modelo con cientos de millones de parámetros. Según el cálculo de 7.8 yuanes/hora por GPU, el costo de entrenamiento de este modelo podría superar los 2 millones de yuanes. Si se trata de entrenar un modelo grande general, el costo podría multiplicarse por cien.
Actualmente, hay más de 100 modelos grandes con una escala de 1.000 millones de parámetros en China. Sin embargo, la "alquimia" de grandes modelos que la industria está persiguiendo enfrenta el problema de que es difícil conseguir GPUs de alta gama. Los altos costos de potencia computacional y la falta de potencia computacional y financiación se han convertido en los problemas más evidentes que enfrenta la industria.
La escasez de GPU de alta gama es un problema sin solución en toda la industria. En su punto máximo, el precio de una A100 se ha disparado a entre dos y trescientos mil yuanes, y el precio de alquiler mensual de un servidor A100 también ha alcanzado entre 50,000 y 70,000 yuanes/mes. Aun así, a pesar de los altos precios, todavía es posible que no se pueda conseguir el chip.
La competencia en el mercado de modelos grandes es intensa, y sin una inversión de miles de millones de dólares, es difícil continuar desarrollando modelos grandes. Algunos emprendedores afirman que, sin el apoyo de cientos de miles de millones, es difícil avanzar por este camino. A medida que el mercado pasa de la euforia a la racionalidad, las empresas también ajustarán sus costos y estrategias de acuerdo con los cambios en las expectativas.
Ante la escasez de potencia computacional, las empresas han tomado diversas medidas de respuesta:
Utilizar datos de mayor calidad para mejorar la eficiencia del entrenamiento
Mejorar la capacidad de infraestructura para lograr un funcionamiento estable de más de mil calorías.
Optimización de la programación de recursos de potencia computacional
De la arquitectura de computación en la nube a la arquitectura de supercomputación
Utilizar plataformas nacionales en lugar de GPU de Nvidia
Estos métodos son cada uno un proyecto relativamente grande, y generalmente es difícil para las empresas satisfacer las demandas mediante la construcción de sus propios centros de datos. Muchos equipos de algoritmos eligen proveedores especializados en Potencia computacional para obtener apoyo.
La potencia computacional se ha convertido en un nuevo modelo de servicio. El servicio de potencia computacional se basa en la diversidad de potencia computacional, se vincula a través de una red de potencia computacional y tiene como objetivo proporcionar potencia computacional efectiva. No solo incluye potencia computacional, sino también un empaquetado unificado de recursos como almacenamiento y red, para completar la entrega de potencia computacional en forma de servicio ( como API ).
Desde la perspectiva de la estructura de la cadena industrial, las empresas de upstream principalmente suministran recursos básicos de Potencia computacional, las empresas de midstream se encargan de la producción y suministro de Potencia computacional, y las empresas de downstream son las que utilizan la Potencia computacional. Actualmente, el cobro por volumen y el pago anual o mensual son los modelos de cobro más comunes.
Con la normalización de la demanda de computación de alto rendimiento de los grandes modelos, los servicios de potencia computacional derivados de los servicios en la nube han entrado rápidamente en la vista del público, formando una cadena industrial y un modelo de negocio únicos. En esta etapa inicial de la explosión de la industria de la potencia computacional, la escasez de GPU de alta gama, el alto costo de la potencia computacional y la competencia por los "chips" se han convertido en un paisaje único de esta era.
A largo plazo, la potencia computacional se convertirá en una tendencia de servicio segura. Los proveedores de servicios de potencia computacional deben estar preparados para ajustar su estrategia a tiempo cuando los grandes modelos regresen a la racionalidad y el rumbo del mercado cambie rápidamente.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
18 me gusta
Recompensa
18
5
Compartir
Comentar
0/400
StakeOrRegret
· 07-14 02:28
No digas nada hasta que el dinero esté en su lugar.
Ver originalesResponder0
ParanoiaKing
· 07-14 02:27
Falta de tarjetas, me volví loco. ¿Cuándo se reproducirá el desastre minero?
Ver originalesResponder0
MEVHunterLucky
· 07-14 02:24
Nuevo desastre minero comienza.
Ver originalesResponder0
DeFiCaffeinator
· 07-14 02:23
Conozcamos un poco sobre el camino de acumular tarjetas gráficas~
La batalla por la potencia computacional en la ola de grandes modelos: ¿cómo pueden los proveedores hacer frente a los nuevos modelos de negocio?
Nuevos modelos de negocio detrás de la lucha por la potencia computacional
La fiebre de "refinar el elixir" de los grandes modelos pasará, pero la Potencia computacional se está convirtiendo en un nuevo modelo de negocio. Los proveedores de servicios de Potencia computacional necesitan prepararse con anticipación y cambiar a tiempo.
Recientemente, investigadores utilizaron datos meteorológicos de 40 años a nivel global y preentrenaron un modelo meteorológico de gran escala con 200 tarjetas GPU en aproximadamente 2 meses, logrando un modelo con cientos de millones de parámetros. Según el cálculo de 7.8 yuanes/hora por GPU, el costo de entrenamiento de este modelo podría superar los 2 millones de yuanes. Si se trata de entrenar un modelo grande general, el costo podría multiplicarse por cien.
Actualmente, hay más de 100 modelos grandes con una escala de 1.000 millones de parámetros en China. Sin embargo, la "alquimia" de grandes modelos que la industria está persiguiendo enfrenta el problema de que es difícil conseguir GPUs de alta gama. Los altos costos de potencia computacional y la falta de potencia computacional y financiación se han convertido en los problemas más evidentes que enfrenta la industria.
La escasez de GPU de alta gama es un problema sin solución en toda la industria. En su punto máximo, el precio de una A100 se ha disparado a entre dos y trescientos mil yuanes, y el precio de alquiler mensual de un servidor A100 también ha alcanzado entre 50,000 y 70,000 yuanes/mes. Aun así, a pesar de los altos precios, todavía es posible que no se pueda conseguir el chip.
La competencia en el mercado de modelos grandes es intensa, y sin una inversión de miles de millones de dólares, es difícil continuar desarrollando modelos grandes. Algunos emprendedores afirman que, sin el apoyo de cientos de miles de millones, es difícil avanzar por este camino. A medida que el mercado pasa de la euforia a la racionalidad, las empresas también ajustarán sus costos y estrategias de acuerdo con los cambios en las expectativas.
Ante la escasez de potencia computacional, las empresas han tomado diversas medidas de respuesta:
Estos métodos son cada uno un proyecto relativamente grande, y generalmente es difícil para las empresas satisfacer las demandas mediante la construcción de sus propios centros de datos. Muchos equipos de algoritmos eligen proveedores especializados en Potencia computacional para obtener apoyo.
La potencia computacional se ha convertido en un nuevo modelo de servicio. El servicio de potencia computacional se basa en la diversidad de potencia computacional, se vincula a través de una red de potencia computacional y tiene como objetivo proporcionar potencia computacional efectiva. No solo incluye potencia computacional, sino también un empaquetado unificado de recursos como almacenamiento y red, para completar la entrega de potencia computacional en forma de servicio ( como API ).
Desde la perspectiva de la estructura de la cadena industrial, las empresas de upstream principalmente suministran recursos básicos de Potencia computacional, las empresas de midstream se encargan de la producción y suministro de Potencia computacional, y las empresas de downstream son las que utilizan la Potencia computacional. Actualmente, el cobro por volumen y el pago anual o mensual son los modelos de cobro más comunes.
Con la normalización de la demanda de computación de alto rendimiento de los grandes modelos, los servicios de potencia computacional derivados de los servicios en la nube han entrado rápidamente en la vista del público, formando una cadena industrial y un modelo de negocio únicos. En esta etapa inicial de la explosión de la industria de la potencia computacional, la escasez de GPU de alta gama, el alto costo de la potencia computacional y la competencia por los "chips" se han convertido en un paisaje único de esta era.
A largo plazo, la potencia computacional se convertirá en una tendencia de servicio segura. Los proveedores de servicios de potencia computacional deben estar preparados para ajustar su estrategia a tiempo cuando los grandes modelos regresen a la racionalidad y el rumbo del mercado cambie rápidamente.