Densidad Keywords
Frecuencia de términos clave
SEOExtrae el texto visible de la página y analiza frecuencia de palabras clave (excluye stopwords)
Acerca de esta herramienta
La herramienta de Densidad de Keywords de lab.m8d.io analiza la frecuencia y distribución de términos clave en cualquier página web. Extrae el contenido visible (excluyendo scripts, estilos, navegación y footer), tokeniza el texto con soporte Unicode completo, calcula la densidad de palabras individuales, bigramas y trigramas, y verifica la presencia de las keywords principales en los elementos SEO críticos (title, meta description, H1). Incluye métricas de diversidad léxica y estadísticas de legibilidad.
Qué analiza esta herramienta
El análisis de densidad de keywords cubre múltiples dimensiones del contenido textual:
• Palabras clave individuales — Frecuencia de cada palabra significativa (excluyendo stopwords en español e inglés), ordenadas por número de apariciones. Cada keyword muestra su conteo absoluto y densidad porcentual respecto al total de palabras significativas.
• Bigramas — Frases de 2 palabras que aparecen al menos 2 veces. Los bigramas revelan combinaciones recurrentes que pueden indicar temas principales o keyword stuffing si la densidad es excesiva.
• Trigramas — Frases de 3 palabras con mínimo 2 apariciones. Los trigramas capturan expresiones y conceptos más específicos que las palabras individuales.
• Presencia en meta SEO — Verifica si las 10 keywords principales del contenido aparecen en el título (<title>), la meta description y el encabezado principal (H1). Una keyword prominente en el contenido que no aparece en estos elementos indica una oportunidad de optimización.
• Estadísticas generales — Total de palabras, palabras únicas, diversidad léxica (ratio de palabras únicas sobre total), número de oraciones y promedio de palabras por oración.
Densidad de keywords y SEO
La densidad de keywords es el porcentaje de veces que una palabra aparece respecto al total de palabras del texto. Históricamente fue un factor SEO importante, pero su rol ha evolucionado:
• Densidad recomendada — No existe un porcentaje ideal fijo. El consenso general sugiere que la keyword principal debería tener una densidad entre 1% y 3%. Por encima del 3-4% puede considerarse keyword stuffing.
• Keyword stuffing — La repetición excesiva de una keyword para manipular el ranking es una técnica penalizada por Google desde el algoritmo Panda (2011). Los algoritmos modernos como BERT y MUM entienden semántica y contexto, no solo frecuencia.
• LSI Keywords — Las keywords semánticamente relacionadas (Latent Semantic Indexing) son tan importantes como la keyword principal. Una buena diversidad léxica indica contenido natural y completo.
• TF-IDF — La métrica moderna más relevante es Term Frequency-Inverse Document Frequency, que pondera la frecuencia de un término contra su frecuencia en el corpus general de documentos. Una palabra muy común en todos los sitios tiene menos valor SEO que un término específico de tu nicho.
• E-E-A-T — Google evalúa Experiencia, Expertise, Autoridad y Confiabilidad. El contenido natural, exhaustivo y bien estructurado es más valioso que la optimización mecánica de densidad.
Interpretación de los resultados
Para aprovechar al máximo el análisis:
1. Comparar keywords con intención — Las keywords más frecuentes deben alinearse con la intención de búsqueda que quieres captar. Si tu página es sobre "hosting web" pero la keyword más frecuente es "empresa", hay un desajuste temático.
2. Revisar bigramas y trigramas — Las frases de 2-3 palabras suelen ser más descriptivas del tema real que las palabras individuales. "alojamiento web" o "servidor dedicado" dicen más que "servidor" solo.
3. Verificar presencia en meta — Una keyword con alta densidad en el contenido que no aparece en el title o H1 es una señal de optimización on-page incompleta. El title y H1 deben contener la keyword principal.
4. Evaluar diversidad léxica — Un ratio superior al 40-50% indica vocabulario variado y contenido natural. Un ratio muy bajo puede indicar contenido repetitivo o pobre.
5. Stopwords — La herramienta filtra automáticamente stopwords (artículos, preposiciones, conjunciones) en español e inglés para mostrar solo palabras con carga semántica. La pestaña de todas las palabras permite ver la distribución completa incluyendo stopwords.
Preguntas frecuentes
¿Cuál es la densidad de keywords ideal para SEO?
No existe una densidad ideal universal. La recomendación general es mantener la keyword principal entre 1% y 3% del contenido. Sin embargo, Google no usa un umbral fijo. Lo importante es que el contenido suene natural y cubra el tema de forma exhaustiva. Un contenido de 2,000 palabras con la keyword al 1.5% es mejor que uno de 500 palabras con la keyword al 5%.
¿Qué son los stopwords y por qué se filtran?
Los stopwords son palabras funcionales del idioma (artículos, preposiciones, conjunciones) que no aportan significado temático: 'el', 'la', 'de', 'en', 'the', 'a', 'of'. Se filtran porque aparecen en todo tipo de textos independientemente del tema y distorsionarían el análisis de keywords relevantes. La herramienta incluye más de 150 stopwords en español e inglés.
¿Qué es la diversidad léxica y por qué importa?
La diversidad léxica es el ratio entre palabras únicas y el total de palabras (también llamado Type-Token Ratio). Un valor alto indica vocabulario variado y contenido rico. Un valor bajo puede indicar contenido repetitivo o keyword stuffing. Para contenido web de calidad, un ratio entre 40% y 60% es normal. Textos técnicos especializados pueden tener ratios menores por la repetición necesaria de terminología.
¿Por qué se excluyen nav y footer del análisis?
Los elementos de navegación (<nav>) y pie de página (<footer>) contienen texto repetido en todas las páginas del sitio (menús, enlaces, copyright, etc.). Incluirlos distorsionaría el análisis al inflar la frecuencia de palabras como 'inicio', 'contacto', o el nombre de la empresa. La herramienta analiza solo el contenido principal (body) excluyendo estos elementos para obtener métricas representativas del contenido real de la página.