Seguridad encriptación bajo la sombra de la IA: Nuevas amenazas traídas por modelos de lenguaje sin restricciones

2025-07-06 16:14:47

Generación de resúmenes en curso

El lado oscuro de la inteligencia artificial: los desafíos de seguridad que presentan los modelos de lenguaje de gran tamaño sin restricciones

Con el rápido desarrollo de la tecnología de inteligencia artificial, los grandes modelos de lenguaje están cambiando profundamente nuestra forma de vida. Sin embargo, detrás de esta luz brillante, una sombra inquietante se está expandiendo sigilosamente: la aparición de modelos de lenguaje grandes sin restricciones o maliciosos.

Los modelos de lenguaje de gran tamaño sin restricciones son aquellos que han sido intencionalmente diseñados o modificados para eludir los mecanismos de seguridad y las limitaciones éticas incorporadas en los modelos convencionales. A pesar de que los desarrolladores de modelos de corriente principal invierten grandes recursos para prevenir el mal uso de los modelos, algunas personas u organizaciones con malas intenciones comienzan a buscar o desarrollar de forma independiente modelos no restringidos con fines ilegales. Este artículo explorará casos típicos de este tipo de modelos sin restricciones, sus peligros potenciales en la industria de las criptomonedas, así como los desafíos de seguridad relacionados y las estrategias de respuesta.

Peligros de los modelos de lenguaje de gran tamaño sin restricciones

La aparición de este tipo de modelos ha reducido significativamente el umbral para el cibercrimen. Tareas que antes requerían habilidades profesionales, como escribir código malicioso, crear correos electrónicos de phishing o planear estafas, ahora pueden ser fácilmente realizadas por personas comunes sin experiencia en programación, gracias a la ayuda de modelos sin restricciones. Los atacantes solo necesitan obtener los pesos y el código fuente del modelo de código abierto, y luego afinarlo utilizando un conjunto de datos que contenga contenido malicioso o instrucciones ilegales, para crear herramientas de ataque personalizadas.

Esta tendencia trae múltiples riesgos: los atacantes pueden personalizar modelos dirigidos a objetivos específicos, generando contenido más engañoso y eludiendo la revisión de contenido de modelos convencionales; los modelos también pueden generar rápidamente variantes de código de sitios web de phishing, o crear textos de fraude adaptados a diferentes plataformas; al mismo tiempo, la accesibilidad de modelos de código abierto también está fomentando la formación de un ecosistema de IA subterránea, proporcionando un terreno fértil para el comercio ilegal.

Modelos de lenguaje grandes típicos sin restricciones y sus posibles peligros

WormGPT: versión oscura de GPT

WormGPT es un modelo malicioso que se vende públicamente en foros clandestinos, afirmando no tener ninguna restricción ética. Está basado en modelos de código abierto como GPT-J 6B y se entrena en una gran cantidad de datos relacionados con malware. Los usuarios solo necesitan pagar 189 dólares para obtener un mes de acceso. El uso más infame de WormGPT es generar correos electrónicos de ataques de infiltración comercial y correos electrónicos de phishing altamente realistas.

En el ámbito de las criptomonedas, WormGPT podría ser mal utilizado para:

Generar correos electrónicos de phishing: imitar a los intercambios o a los proyectos enviando solicitudes de "verificación de cuenta", induciendo a los usuarios a revelar sus claves privadas.
Escribir código malicioso: Ayudar a los atacantes con un nivel técnico más bajo a escribir programas maliciosos que roben archivos de billetera.
Automatización del fraude: responder automáticamente a las potenciales víctimas, guiándolas a participar en airdrops falsos o proyectos de inversión.

DarkBERT: la espada de doble filo del contenido de la dark web

DarkBERT es un modelo de lenguaje preentrenado en datos de la dark web, cuyo objetivo inicial es proporcionar herramientas a investigadores de seguridad y agencias de aplicación de la ley para comprender mejor la ecología de la dark web. Sin embargo, si es utilizado por delincuentes o se entrena un modelo sin restricciones imitando este, los peligros potenciales incluyen:

Implementar fraudes precisos: recopilar información de usuarios de criptomonedas y equipos de proyectos para fraudes de ingeniería social.
Copiar métodos delictivos: imitar estrategias maduras de robo de criptomonedas y lavado de dinero en la dark web.

FraudGPT: el cuchillo suizo del fraude en línea

FraudGPT se dice que es la versión mejorada de WormGPT, con funciones más completas, principalmente se vende en la dark web y en foros de hackers. En el ámbito de las criptomonedas, podría ser mal utilizado para:

Proyectos de criptomonedas falsificados: generar libros blancos, sitios web y hojas de ruta realistas para llevar a cabo ICOs fraudulentos.
Generación masiva de páginas de phishing: crea rápidamente páginas de inicio de sesión que imitan a intercambios de renombre.
Actividades de bots en redes sociales: fabricación masiva de comentarios falsos, promoción de tokens fraudulentos o desprestigio de proyectos competidores.
Ataques de ingeniería social: imitar conversaciones humanas, establecer confianza con los usuarios y inducir la divulgación de información sensible.

GhostGPT: asistente de IA sin restricciones morales

GhostGPT es un chatbot de IA claramente posicionado sin restricciones morales. En el ámbito de las criptomonedas, podría ser mal utilizado para:

Ataques de phishing avanzados: generan correos electrónicos de phishing altamente realistas que suplantan a los intercambios y publican solicitudes falsas de verificación KYC.
Generación de código malicioso para contratos inteligentes: Generación rápida de contratos inteligentes que contienen puertas traseras ocultas, utilizados para estafas de Rug Pull.
Robador de criptomonedas polimórfico: genera malware con capacidad de transformación para robar archivos de billetera y claves privadas.
Ataques de ingeniería social: desplegar robots en plataformas sociales para inducir a los usuarios a participar en la acuñación o airdrop de NFT falsos.
Estafa de deepfake: generar voces falsas de fundadores de proyectos o ejecutivos de intercambios para llevar a cabo estafas telefónicas.

Venice.ai: riesgos potenciales de acceso sin censura

Venice.ai ofrece acceso a varios modelos de lenguaje con pocas restricciones. Aunque su enfoque es ser una plataforma abierta para explorar las capacidades de la IA, también puede ser mal utilizada para generar contenido malicioso. Los riesgos potenciales incluyen:

Eludir la censura para generar contenido malicioso: utilizar modelos con menos restricciones para generar plantillas de phishing o ideas de ataque.
Reducir la barrera de entrada para la ingeniería de indicaciones: incluso sin habilidades avanzadas, se puede obtener fácilmente una salida que antes estaba limitada.
Acelerar la iteración de los guiones de ataque: probar rápidamente la reacción de diferentes modelos ante instrucciones maliciosas y optimizar los scripts de fraude.

Conclusión

La aparición de modelos de lenguaje a gran escala sin restricciones marca un nuevo paradigma de ataques más complejos, a gran escala y con capacidades de automatización que enfrenta la ciberseguridad. Esto no solo ha reducido la barrera de entrada para los ataques, sino que también ha traído nuevas amenazas más encubiertas y engañosas.

Ante este desafío, todas las partes del ecosistema de seguridad deben trabajar en conjunto: aumentar la inversión en tecnologías de detección, desarrollar herramientas que puedan identificar y interceptar el contenido generado por modelos maliciosos; promover la construcción de capacidades de defensa contra el jailbreak de modelos, explorar mecanismos de marcas de agua y trazabilidad; establecer un marco ético y un mecanismo de supervisión sólidos para limitar desde la raíz el desarrollo y abuso de modelos maliciosos. Solo con un enfoque multifacético se puede garantizar la seguridad y el desarrollo saludable de la industria de criptomonedas en la era de la IA.

GPT-0.04%

Ver originales

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

21 me gusta