Filtrar Registros duplicados

Buenos días.

Tengo un índice con información del cual hago una visualización tipo Data Table, en la que se ve algo similar a esto:

|Equipo |Count|SCCMSite|Count|
|--- |--- |--- |--- |
|Equipo 1| 3| SMS1| 2|
|Equipo 1| 3| SMS2| 1|
|Equipo 2| 2| SMS1| 1|
|Equipo 2| 2| SMS2| 1|
|Equipo 3| 1| SMS1| 1|
|Equipo 4| 1| SMS1| 1|

Necesitaría filtrar la información para que únicamente me aparecieran en la visualización los equipos duplicados, es decir, que los equipos únicos no se reflejasen, quedando la tabla algo así:

|Equipo |Count|SCCMSite|Count|
|--- |--- |--- |--- |
|Equipo 1| 3| SMS1| 2|
|Equipo 1| 3| SMS2| 1|
|Equipo 2| 2| SMS1| 1|
|Equipo 2| 2| SMS2| 1|

Muchísimas gracias de antemano.

Un saludo.

Hi Manuel,

Sorry for the late response! You can do a terms aggregation and specify the min_doc_count so that only docs with 2 or more results will be returned:

https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations-bucket-terms-aggregation.html#_minimum_document_count_4

Here's an example I ran locally:


GET equipo/_search
{
  "size": 0,
  "aggs": {
    "equipo": {
      "terms": {
        "field": "name.keyword",
        "min_doc_count": 2
      },
      "aggs": {
        "sccm": {
          "terms": {
            "field": "sccm_site.keyword"
          }
        }
      }
    }
  }
}

My docs looked something like this:

POST equipo/doc/6
{
  "name": "equipo 4",
  "sccm_site": "SMS2",
  "timestamp": "2016-08-06T13:24:42.014Z"
}

I don't speak Spanish, so I'm replying in English and Spanish (the Spanish being provided by Google translate, so forgive me if it's spotty.)

Best,
C

Hola Manuel,

¡Lo siento por la respuesta tardía! Puede hacer una agregación de términos y especificar min_doc_count para que solo se devuelvan documentos con 2 o más resultados:

https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations-bucket-terms-aggregation.html#_minimum_document_count_4

Aquí hay un ejemplo que ejecuté localmente:


GET equipo/_search
{
  "size": 0,
  "aggs": {
    "equipo": {
      "terms": {
        "field": "name.keyword",
        "min_doc_count": 2
      },
      "aggs": {
        "sccm": {
          "terms": {
            "field": "sccm_site.keyword"
          }
        }
      }
    }
  }
}

Mis documentos se parecían a esto:

POST equipo/doc/6
{
  "name": "equipo 4",
  "sccm_site": "SMS2",
  "timestamp": "2016-08-06T13:24:42.014Z"
}

No hablo español, así que estoy respondiendo en inglés y español (el español está provisto por Google translate, así que perdónenme si es irregular).