SLM NeoDB — La base de datos vectorizada para sistemas que no pueden fallar

PRECISIÓN NUMÉRICA

0.1 + 0.2 = 0.3. Siempre.

Otras bases de datos te obligan a elegir entre 8+ tipos numéricos. Elige mal y pierdes dinero. NeoDB tiene UN solo tipo.

Oracle / PostgreSQL

8+ tipos numéricos: NUMBER, DECIMAL, FLOAT, DOUBLE PRECISION, REAL, BIGINT, SMALLINT, NUMERIC. Elige el incorrecto y pierdes centavos. En millones de transacciones, pierdes miles.

Elasticsearch

Usa IEEE 754 double. 0.1 + 0.2 = 0.30000000000000004. Inaceptable para dinero. Inaceptable para auditoría. Inaceptable.

NeoDB

UN tipo: number[n]. n = decimales. Precisión exacta. NUNCA redondea. Si envías decimales de más, rechaza con error.

Precisión

// Elasticsearch (IEEE 754 double)
0.1 + 0.2 = 0.30000000000000004    <-- WRONG

// NeoDB (number[2])
0.1 + 0.2 = 0.30                    <-- EXACT. Always.

number[0] = entero. number[2] = dinero. number[8] = crypto. Un tipo. Cero errores.

DESARROLLO PROGRESIVO

Empieza con nada. Crece sin límites.

NeoDB es como un mapa mental para tus datos. No necesitas diseñar todo desde el principio. Empieza a guardar, descubre lo que necesitas, y crece progresivamente.

Guarda lo que sea

Sin schema. Manda JSON y NeoDB lo acepta. No necesitas saber la estructura final.

Busca y descubre

Haz queries, busca por texto, filtra. Los datos te dicen qué estructura necesitas.

Agrega schema cuando quieras

Define tipos, validaciones, strict mode. En caliente. Sin downtime. Sin migrar datos.

Crece sin romper nada

Agrega campos, crea nuevos tipos, nuevos índices. Los datos existentes no se tocan.

En SQL, diseñas tablas antes de escribir la primera línea de código. En NeoDB, escribes código desde el minuto uno y el schema evoluciona contigo. Es la base de datos para equipos que construyen productos, no para equipos que diseñan schemas.

SEGURIDAD

Seguridad bancaria nativa.

No es un plugin. No es un add-on. Está en el motor.

blind type

Tu DBA no puede filtrar un PAN porque fisicamente nunca toca el disco. El motor lo hashea con BLAKE3 antes de almacenarlo. El valor original se descarta en RAM. Para siempre.

SLM-KEY + CIDR

Una API key robada es inútil fuera del rango de IP autorizado. Silent drop — el atacante ni siquiera recibe un mensaje de error.

Field masking

El equipo de reportes ve transacciones pero nunca ve números de tarjeta. Field masking por key, aplicado a nivel del motor.

Audit log

Cada operación. Cada key. Cada IP. Inmutable. PCI DSS REQ 10 compliant de fábrica.

Silent drop

Los requests inválidos reciben TCP close. Sin respuesta HTTP. Sin código de error. Sin fuga de información. El atacante no sabe en qué paso falló.

Quantum-resistant

BLAKE3 de 256 bits — 128 bits de seguridad post-quantum. Los datos hasheados con blind (PANs, identificaciones, datos sensibles) permanecen protegidos incluso contra computadoras cuánticas futuras. Impracticable con tecnología actual o futura previsible.

INMUTABILIDAD

Nivel blockchain. Sin blockchain.

Cada operación queda en un ledger inmutable con timestamp, identidad y evidencia criptográfica. Sin nodos, sin gas, sin consenso distribuido.

Nada se borra

Soft deletes. Cada versión de cada documento queda en el historial. Un auditor puede reconstruir el estado de cualquier dato en cualquier momento del pasado.

Ledger automático

Cada operación registrada con: quién (key_id), cuándo (timestamp), desde dónde (IP), qué hizo (acción), resultado (ALLOWED/DENIED), duración. Append-only. Nadie puede modificarlo.

Evidencia criptográfica

BLAKE3 de 256 bits (quantum-resistant). Cada hash es prueba matemática de integridad. IDs con UUID v7 cronológico — orden garantizado por el protocolo, no por un reloj.

Blockchain

Nodos, consenso distribuido, gas fees, latencia de confirmación, throughput limitado, complejidad operativa extrema.

NeoDB

Un binario, fsync inmediato, 21K escrituras/segundo, audit log inmutable, hashing quantum-resistant, zero complejidad operativa. Misma inmutabilidad. Sin el overhead.

CÓDIGO

Crear. Buscar. Agregar.

REST + JSON. Sin SQL. Sin ORM. Sin drivers.

# Crear
curl -X POST :7700/banco/user/1 \
  -H "SLM-KEY: $KEY" \
  -d '{"nombre":"Luis","saldo":1500.25}'

# Buscar
curl -X POST :7700/banco/user/_search \
  -H "SLM-KEY: $KEY" \
  -d '{"query":{"match":{"nombre":"luis"}}}'

# Agregar
curl -X POST :7700/banco/transaction/_search \
  -H "SLM-KEY: $KEY" \
  -d '{"aggs":{"total":{"sum":{"field":"monto"}}},"size":0}'

// Crear
await neodb("POST", "/banco/user/1", {
  nombre: "Luis",
  saldo: 1500.25
});

// Buscar
const results = await neodb("POST", "/banco/user/_search", {
  query: { match: { nombre: "luis" } }
});

// Agregar
const stats = await neodb("POST", "/banco/transaction/_search", {
  aggs: { total: { sum: { field: "monto" } } },
  size: 0
});

# Crear
neodb.post("/banco/user/1", {
    "nombre": "Luis",
    "saldo": 1500.25
})

# Buscar
results = neodb.post("/banco/user/_search", {
    "query": {"match": {"nombre": "luis"}}
})

# Agregar
stats = neodb.post("/banco/transaction/_search", {
    "aggs": {"total": {"sum": {"field": "monto"}}},
    "size": 0
})

FUNCIONES

Todo lo que necesitas.

Cada función está implementada y probada. 349 tests. 0 warnings.

ACID Writes

fsync antes de ACK. Sobrevive corte de luz.

Full-Text Search

Tantivy — Apache Lucene reescrito en Rust. La misma tecnología que usa Elasticsearch pero sin JVM, sin GC pauses, 2x más rápido. BM25. <1ms sobre millones.

Aggregations

SUM/AVG/MAX/MIN/terms/histogram. Fast fields nativos.

number[n]

Precisión decimal exacta. Sin errores IEEE 754.

blind

BLAKE3 hash. El PAN nunca toca el disco. PCI DSS.

SLM-KEY + CIDR

API key + binding por IP. Silent drop.

Audit Log

Cada operación registrada. Inmutable. PCI REQ 10.

Soft Deletes

Nada se pierde. Historial completo.

Rhai Scripting

Campos calculados. Aggregations stateful. Sandbox.

Vector / HNSW

KNN con cosine/dot/euclidean. Auto-normalización.

Geo Queries

geo_distance, geo_bounding_box, Haversine.

CDC

Feed de cambios en tiempo real desde el WAL.

Bulk Write

21K docs/seg. Un solo fsync por batch.

Morpheus Console

Dev tools embebido. Como Kibana.

Prometheus

Endpoint /_metrics. Grafana-ready.

Index Aliases

Rotación zero-downtime. Blue-green deploys.

SERIES DE TIEMPO

Logs y time-series. Nativos.

Rotación de índices, búsqueda con glob, TTL automático y date_histogram. Sin Loki. Sin InfluxDB. Sin TimescaleDB. Con ACID y full-text search.

time-series

# Index rotation — one index per month
curl -X POST :7700/trxs-2026-01/transaction/1 \
  -d '{"tipo":"deposito","monto":500.00,"fecha":"2026-01-15"}'

# Glob search — query across all months
curl -X POST :7700/trxs-2026-*/_search \
  -d '{"query":{"range":{"monto":{"gte":100}}}}'

# date_histogram — aggregate by month
curl -X POST :7700/trxs-*/_search \
  -d '{"aggs":{"by_month":{"date_histogram":{
      "field":"fecha","calendar_interval":"month"}}},
    "size":0}'

# TTL — auto-expire logs after 90 days
curl -X PUT :7700/logs-2026-01/_settings \
  -d '{"ttl":"90d"}'

Rotación trxs-2026-01, trxs-2026-02...

Glob POST /trxs-2026-*/_search

TTL Expiración automática

ACID Cada log es ACID

SCRIPTING

100K transacciones actualizadas en 7 segundos.

Scripts server-side en Rhai. Sin round-trips. Sin descargar datos. El cálculo se ejecuta dentro del motor.

_update_by_query

// Apply IVA to 100K transactions in one request
POST /banco/transaction/_update_by_query
{
  "query": {"term": {"tipo": "deposito"}},
  "script": "this.monto = this.monto * 1.16"
}
// 100,000 transactions x IVA calculation = 6.81 seconds

_update_by_query

Actualiza miles de documentos con un script

script_fields

Campos calculados en tiempo de búsqueda

script_score

Relevancia personalizada con lógica de negocio

script_state

Aggregations stateful con acumulador

HERRAMIENTA DE DESARROLLO

Morpheus Console.

Una consola de desarrollo embebida en cada instancia de NeoDB. Como Kibana Dev Tools — pero sin instalar nada extra.

Escribe queries directamente

Editor Monaco (el mismo de VS Code) con autocompletado del DSL de NeoDB. Escribe GET /_health, presiona Ctrl+Enter, ve el resultado al lado. Sin Postman, sin curl, sin configurar nada.

Accesible desde cualquier browser

Abre http://tu-servidor:7700/_console desde cualquier máquina. Tus workspaces se guardan en la misma base de datos. Cambias de laptop y todo está ahí.

Morpheus Console

# Así se ve. Escribe el verbo, el path, y el body.
# Ctrl+Enter para ejecutar. Resultado a la derecha.

GET /_health

POST /banco/user/_search
{
  "query": { "match": { "nombre": "luis" } },
  "size": 10
}

POST /banco/transaction/_search
{
  "aggs": { "total": { "sum": { "field": "monto" } } },
  "size": 0
}

Disponible en /_console de cada instancia. Zero instalación. Zero configuración.

ZERO DRIVER

Si habla HTTP, ya es un cliente.

NeoDB es REST + JSON. No necesitas driver, SDK, librería ni ORM. Cualquier dispositivo o lenguaje con un cliente HTTP puede escribir, leer, buscar y agregar datos.

🔧

ESP32 / Arduino

WiFi + HTTP POST = base de datos

🍓

Raspberry Pi

Edge computing con ACID real

📱

Apps móviles

fetch() nativo, sin SDK

🤖

Cualquier lenguaje

Python, Rust, Go, Node, C, Java...

ESP32 (C/Arduino)

// Un ESP32 escribiendo telemetría a NeoDB
// Solo necesita WiFi y HTTP. Nada más.

HTTPClient http;
http.begin("http://neodb:7700/iot/sensor/temp-001");
http.addHeader("SLM-KEY", KEY);
http.addHeader("Content-Type", "application/json");

int code = http.POST("{\"temp\":23.5,\"humidity\":65,\"ts\":1774477000}");
// 201 Created — ACID, durable, searchable, aggregatable

Sin drivers que mantener. Sin compatibilidad de versiones. Sin dependencias. Si tu dispositivo puede hacer un HTTP POST con JSON, ya puede usar NeoDB con todas sus capacidades: ACID, búsqueda, aggregations, vectores.

COMPARACIÓN

Comparación honesta.

No decimos que NeoDB es mejor en todo. Estos son los hechos.

	PostgreSQL	Elasticsearch	MongoDB	NeoDB
Full-text search	Lento	Excelente	Básico	Excelente (<1ms)
Vector search	pgvector ext	Limitado	Atlas Search	HNSW nativo
Aggregations	Lento en escala	Bueno	Bueno	Rápido (fast fields)
Consistencia ACID	Fuerte	Eventual	Configurable	Fuerte (fsync siempre)
Schema flexible	ALTER TABLE	Dinámico	Dinámico	Dinámico, zero downtime
Audit log	Manual	Manual	Manual	Nativo, automático
Crash recovery	WAL	Translog	Journal	WAL + auto-replay
PCI DSS	Manual	Plugin	Manual	Nativo (blind, audit, CIDR)
RAM min	~256MB	4-16GB	~256MB	128MB
Setup	Horas	Horas	Horas	30 segundos

vs Bases de datos relacionales y BaaS

	Oracle	MySQL	SQL Server	Supabase	NeoDB
Full-text search	Oracle Text (complejo)	Muy básico	Básico	pg tsvector (lento)	Excelente (<1ms)
Vector search	No	No	No	pgvector ext	HNSW nativo
Aggregations	Requiere tuning	Lento en escala	Requiere tuning	SQL GROUP BY	Rápido (fast fields)
Consistencia ACID	Fuerte	Fuerte (InnoDB)	Fuerte	Fuerte (PostgreSQL)	Fuerte (fsync siempre)
Schema flexible	ALTER TABLE	ALTER TABLE	ALTER TABLE	Migraciones	Dinámico, zero downtime
Audit log	Enterprise ($$)	Plugin	Enterprise ($$)	Manual	Nativo, automático
Crash recovery	REDO log	InnoDB log	Transaction log	WAL	WAL + auto-replay
PCI DSS	TDE ($$)	Manual	TDE ($$)	Manual	Nativo (blind, audit, CIDR)
RAM min	2-4GB	~512MB	2GB	~512MB	128MB
Setup	Días/semanas	Horas	Días	Minutos (cloud)	30 segundos

CARA A CARA

Comparaciones directas.

vs Elasticsearch

Elasticsearch

✗ Near real-time — 1-2s lag
✗ Sin ACID. Translog no hace fsync
✗ 3 nodos × 16GB RAM mínimo
✗ JVM: warmup, GC pauses
✗ ~$2,100/mes AWS

NeoDB

✓ Visibilidad inmediata (fsync'd)
✓ ACID completo. WAL + fsync
✓ 128MB RAM. Un solo binario
✓ Rust. Zero GC. Latencia predecible
✓ ~$280/mes AWS

vs PostgreSQL + Elasticsearch

Dos bases de datos. Dos schemas. Un pipeline de sincronización que eventualmente se rompe. Cuando eso pasa, preguntas: ¿cuál tiene el dato real? NeoDB es una sola fuente de verdad.

vs Supabase / Firebase

	Supabase	NeoDB
Full-text search	PostgreSQL tsvector	Tantivy <1ms
Aggregations	SQL GROUP BY	Nativos (sum, terms, histogram)
Vector search	pgvector ext	HNSW nativo
PCI	Manual	Nativo (blind, audit, CIDR)
Schema changes	Migraciones	Sin downtime

vs Bases de datos vectoriales

Pinecone, Weaviate, Qdrant — solo hacen búsqueda vectorial. ¿Necesitas transacciones? Agrega PostgreSQL. ¿Búsqueda de texto? Agrega Elasticsearch. ¿Analítica? Agrega ClickHouse. Son 4 sistemas. NeoDB hace los 4. Un binario. Una factura.

BASE DE DATOS VECTORIZADA

Tu base de datos ya tiene IA.

NeoDB es una base de datos vectorizada. Almacena embeddings junto a tus datos transaccionales y los busca por similitud semántica. Sin Pinecone. Sin infraestructura extra. Sin otra factura.

Stack tradicional para RAG

✗ PostgreSQL (transacciones)
✗ Elasticsearch (búsqueda texto)
✗ Pinecone/Weaviate (vectores)
✗ Redis (caché)
= 4 sistemas, 4 facturas, 4 puntos de fallo

NeoDB

✓ ACID (transacciones)
✓ Tantivy (búsqueda texto)
✓ HNSW (vectores)
✓ Fast fields (analytics)
= 1 binario, 1 fuente de verdad

RAG en 3 pasos

# 1. Guarda tu documento con su embedding
curl -X POST :7700/knowledge/article/1 \
  -d '{"titulo":"Política de cancelación",
      "contenido":"El cliente tiene 48 horas para cancelar...",
      "embedding":[0.023, -0.041, 0.018, ...]}'

# 2. Busca por significado (no por palabras)
curl -X POST :7700/knowledge/article/_search \
  -d '{"query":{"knn":{
      "field":"embedding",
      "vector":[0.019, -0.038, ...],
      "k":5,
      "min_score":0.7}}}'

# 3. Los resultados van a tu LLM como contexto
# NeoDB no sabe de LLMs. Solo guarda y busca vectores.
# Tú eliges el modelo. Hoy OpenAI, mañana Ollama. NeoDB no cambia.

HNSW índice vectorial nativo

3 métricas de distancia

auto detección de dimensiones

NeoDB es agnóstica. No genera embeddings. No depende de ningún LLM. Solo almacena arrays de números y los busca por similitud matemática. De dónde vengan esos números es decisión tuya.

PREGUNTAS DIFÍCILES

Eres escéptico. Bien.

"Es nuevo. Sin historial."

El motor de storage es RocksDB — usado por Facebook, Uber, Netflix, CockroachDB. El motor de búsqueda es Tantivy — Apache Lucene reescrito en Rust, la misma base que usa Elasticsearch pero 2x más rápido y sin JVM. Lo usa Brave Search en producción. El lenguaje es Rust — adoptado por AWS, Microsoft, Google, el kernel de Linux. Lo nuevo es la integración.

"¿Por qué no PostgreSQL + Elasticsearch?"

Porque eventualmente tus datos en Elasticsearch van a diferir de los de PostgreSQL. Y vas a pasar semanas descubriendo cuál tiene la razón. Con NeoDB hay una sola fuente de verdad. Siempre.

"¿Aguanta nuestra escala?"

1.1 millones de documentos en 60 segundos. Búsqueda full-text en <1ms. SUM de 500K transacciones en 14ms. 21,000 escrituras/segundo. En un solo nodo con 128MB de RAM.

"¿Es realmente ACID?"

Cada escritura hace fsync al WAL antes de responder. Si el proceso muere, el WAL recovery completa las operaciones pendientes. Si el servidor pierde energía, el dato está en disco. Pruébalo: inserta un documento, haz kill -9 al proceso, reinicia. Tu documento está ahí.

"¿Sin SQL? ¿Cómo hago queries complejos?"

El DSL JSON de NeoDB maneja: combinaciones booleanas (AND/OR/NOT), rangos numéricos y de fechas, búsqueda full-text con relevancia, fuzzy (tolerancia a typos), geo por radio, vectores por similitud, wildcards, y aggregations con sub-aggregations. Todo en un request. Y lo que SQL no puede: búsqueda de texto en <1ms sobre 100 millones de registros.

"¿Y los JOINs? Sin JOINs no puedo trabajar."

En NeoDB el middleware hace los JOINs — y resulta que es más rápido. Haces 2-3 queries paralelos a NeoDB (cada uno en <1ms) y ensamblas en tu middleware con la lógica de negocio que ya tienes. En SQL un JOIN de 3 tablas con millones de filas puede tomar segundos. En NeoDB son 3 requests paralelos de <1ms cada uno.

"¿Cómo hago un SELECT * FROM users WHERE active = true AND balance > 1000 ORDER BY name?"

{"query":{"bool":{"must":[{"term":{"active":true}},{"range":{"balance":{"gt":1000}}}]}},"sort":[{"name":"asc"}]}

Misma lógica, sintaxis JSON. Y a diferencia de SQL, también puedes buscar texto, agregar aggregations, y filtrar por geo o vectores en el mismo query.

"¿Y si necesito cambiar el schema con 50 millones de registros?"

Agrega campos nuevos en caliente con PATCH /_schema. Sin ALTER TABLE. Sin migraciones. Sin downtime. Sin bloquear lecturas ni escrituras. Los documentos existentes siguen funcionando — los campos nuevos simplemente no existen en los viejos. Sin schema (modo dinámico), aceptas cualquier JSON sin declarar nada.

"¿Qué pasa con los errores de punto flotante? En banca eso es inaceptable."

NeoDB no usa punto flotante para números. El tipo number[n] almacena como entero escalado: 25.10 con number[2] se guarda como 2510 (i64). Aritmética exacta. Sin IEEE 754. Sin redondeo. Si mandas 3 decimales a un campo de 2, el motor rechaza con error. No inventa, no redondea, no trunca.

"¿Cumple PCI DSS? Mi auditor va a preguntar."

NeoDB fue diseñado desde el día uno con PCI DSS v4.0 en mente. El tipo blind hace que el PAN nunca toque el disco (solo hash BLAKE3 irreversible). El audit log registra cada operación de forma inmutable. SLM-KEY con CIDR binding asegura que una credencial robada no sirve fuera de las IPs autorizadas. Field masking elimina campos sensibles por key. Tenemos un documento completo mapeando cada requerimiento PCI.

"¿Y las transacciones multi-documento?"

En v1, cada documento es atómico por separado. Para operaciones que involucran múltiples documentos, el middleware maneja la coordinación — que es donde vive tu lógica de negocio de todas formas. El update_by_query permite actualizar miles de documentos en una sola operación atómica con scripts.

La base de datos para sistemas que no pueden fallar.

PostgreSQL + pgvector

Elasticsearch

Pinecone / Weaviate / Qdrant

NeoDB

0.1 + 0.2 = 0.3. Siempre.

Oracle / PostgreSQL

Elasticsearch

NeoDB

El motor absorbe la complejidad para que el developer se enfoque en su producto.

Empieza con nada. Crece sin límites.

Guarda lo que sea

Busca y descubre

Agrega schema cuando quieras

Crece sin romper nada

No es un prototipo.

Seguridad bancaria nativa.

blind type

SLM-KEY + CIDR

Field masking

Audit log

Silent drop

Quantum-resistant

Nivel blockchain. Sin blockchain.

Nada se borra

Ledger automático

Evidencia criptográfica

Blockchain

NeoDB

Has tenido que elegir.

PostgreSQL

Elasticsearch

Ambos juntos

NeoDB

Números reales. Sin marketing.

Un binario. Cero configuración.

Crear. Buscar. Agregar.

Todo lo que necesitas.

ACID Writes

Full-Text Search

Aggregations

number[n]

blind

SLM-KEY + CIDR

Audit Log

Soft Deletes

Rhai Scripting

Vector / HNSW

Geo Queries

CDC

Bulk Write

Morpheus Console

Prometheus

Index Aliases

Logs y time-series. Nativos.

100K transacciones actualizadas en 7 segundos.

_update_by_query

script_fields

script_score

script_state

Morpheus Console.

Escribe queries directamente

Accesible desde cualquier browser

Si habla HTTP, ya es un cliente.

ESP32 / Arduino

Raspberry Pi

Apps móviles

Cualquier lenguaje

Comparación honesta.

vs Bases de datos relacionales y BaaS

Comparaciones directas.

vs Elasticsearch

Elasticsearch

NeoDB

vs PostgreSQL + Elasticsearch

vs Supabase / Firebase

vs Bases de datos vectoriales

No son ejemplos de juguete.

Fintech: 10K transacciones/día

Gobierno: 50M registros