Custom filer to extract some phrases

Hi,

I would like to build a custom analyzer to extract only specific phrases
from a text.

text:
"te vermeerderen met 8% vakantietoeslag en een dertiende maand zolang als
het dienstverband voortduurt en voorts tot betaling van de wettelijke boete
ex artikel 7:625 BW over de inmiddels verschenen loontermijnen en tot
betaling van de wettelijke rente vanaf de, naar het hof begrijpt, vervaldag
van iedere afzonderlijke loontermijn ex artikel 7:623 BW, althans"

Result shoud be: "artikel 7:625 BW" and " artikel 7:623 BW"

The syntax for the analyzer is:
"pattern": "(art.*?BW)",
"type": "pattern"

But in stead of the two phrases it returns all the text except the phrase,
using the phrases as delimiter.

Wat do I need to do to get only the two phrases returned for this analyzer?

Thanks, Marcel

--
You received this message because you are subscribed to the Google Groups "elasticsearch" group.
To unsubscribe from this group and stop receiving emails from it, send an email to elasticsearch+unsubscribe@googlegroups.com.
For more options, visit https://groups.google.com/groups/opt_out.

Marcel,

Perhaps this would help?

http://www.elasticsearch.org/guide/reference/index-modules/analysis/pattern-capture-tokenfilter/

Brian

On Saturday, August 10, 2013 3:30:59 AM UTC-4, Faillissements Dossier wrote:

Hi,

I would like to build a custom analyzer to extract only specific phrases
from a text.

text:
"te vermeerderen met 8% vakantietoeslag en een dertiende maand zolang als
het dienstverband voortduurt en voorts tot betaling van de wettelijke boete
ex artikel 7:625 BW over de inmiddels verschenen loontermijnen en tot
betaling van de wettelijke rente vanaf de, naar het hof begrijpt, vervaldag
van iedere afzonderlijke loontermijn ex artikel 7:623 BW, althans"

Result shoud be: "artikel 7:625 BW" and " artikel 7:623 BW"

The syntax for the analyzer is:
"pattern": "(art.*?BW)",
"type": "pattern"

But in stead of the two phrases it returns all the text except the phrase,
using the phrases as delimiter.

Wat do I need to do to get only the two phrases returned for this analyzer?

Thanks, Marcel

--
You received this message because you are subscribed to the Google Groups "elasticsearch" group.
To unsubscribe from this group and stop receiving emails from it, send an email to elasticsearch+unsubscribe@googlegroups.com.
For more options, visit https://groups.google.com/groups/opt_out.