Filtrar Registros duplicados

Buenos días.

Tengo un índice con información del cual hago una visualización tipo Data Table, en la que se ve algo similar a esto:

|Equipo |Count|SCCMSite|Count|
|--- |--- |--- |--- |
|Equipo 1| 3| SMS1| 2|
|Equipo 1| 3| SMS2| 1|
|Equipo 2| 2| SMS1| 1|
|Equipo 2| 2| SMS2| 1|
|Equipo 3| 1| SMS1| 1|
|Equipo 4| 1| SMS1| 1|

Necesitaría filtrar la información para que únicamente me aparecieran en la visualización los equipos duplicados, es decir, que los equipos únicos no se reflejasen, quedando la tabla algo así:

|Equipo |Count|SCCMSite|Count|
|--- |--- |--- |--- |
|Equipo 1| 3| SMS1| 2|
|Equipo 1| 3| SMS2| 1|
|Equipo 2| 2| SMS1| 1|
|Equipo 2| 2| SMS2| 1|

Muchísimas gracias de antemano.

Un saludo.

Hi Manuel,

Sorry for the late response! You can do a terms aggregation and specify the min_doc_count so that only docs with 2 or more results will be returned:

https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations-bucket-terms-aggregation.html#_minimum_document_count_4

Here's an example I ran locally:


GET equipo/_search
{
  "size": 0,
  "aggs": {
    "equipo": {
      "terms": {
        "field": "name.keyword",
        "min_doc_count": 2
      },
      "aggs": {
        "sccm": {
          "terms": {
            "field": "sccm_site.keyword"
          }
        }
      }
    }
  }
}

My docs looked something like this:

POST equipo/doc/6
{
  "name": "equipo 4",
  "sccm_site": "SMS2",
  "timestamp": "2016-08-06T13:24:42.014Z"
}

I don't speak Spanish, so I'm replying in English and Spanish (the Spanish being provided by Google translate, so forgive me if it's spotty.)

Best,
C

Hola Manuel,

¡Lo siento por la respuesta tardía! Puede hacer una agregación de términos y especificar min_doc_count para que solo se devuelvan documentos con 2 o más resultados:

https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations-bucket-terms-aggregation.html#_minimum_document_count_4

Aquí hay un ejemplo que ejecuté localmente:


GET equipo/_search
{
  "size": 0,
  "aggs": {
    "equipo": {
      "terms": {
        "field": "name.keyword",
        "min_doc_count": 2
      },
      "aggs": {
        "sccm": {
          "terms": {
            "field": "sccm_site.keyword"
          }
        }
      }
    }
  }
}

Mis documentos se parecían a esto:

POST equipo/doc/6
{
  "name": "equipo 4",
  "sccm_site": "SMS2",
  "timestamp": "2016-08-06T13:24:42.014Z"
}

No hablo español, así que estoy respondiendo en inglés y español (el español está provisto por Google translate, así que perdónenme si es irregular).

This topic was automatically closed 28 days after the last reply. New replies are no longer allowed.