I would like to build a custom analyzer to extract only specific phrases
from a text.
text:
"te vermeerderen met 8% vakantietoeslag en een dertiende maand zolang als
het dienstverband voortduurt en voorts tot betaling van de wettelijke boete
ex artikel 7:625 BW over de inmiddels verschenen loontermijnen en tot
betaling van de wettelijke rente vanaf de, naar het hof begrijpt, vervaldag
van iedere afzonderlijke loontermijn ex artikel 7:623 BW, althans"
Result shoud be: "artikel 7:625 BW" and " artikel 7:623 BW"
The syntax for the analyzer is:
"pattern": "(art.*?BW)",
"type": "pattern"
But in stead of the two phrases it returns all the text except the phrase,
using the phrases as delimiter.
Wat do I need to do to get only the two phrases returned for this analyzer?
On Saturday, August 10, 2013 3:30:59 AM UTC-4, Faillissements Dossier wrote:
Hi,
I would like to build a custom analyzer to extract only specific phrases
from a text.
text:
"te vermeerderen met 8% vakantietoeslag en een dertiende maand zolang als
het dienstverband voortduurt en voorts tot betaling van de wettelijke boete
ex artikel 7:625 BW over de inmiddels verschenen loontermijnen en tot
betaling van de wettelijke rente vanaf de, naar het hof begrijpt, vervaldag
van iedere afzonderlijke loontermijn ex artikel 7:623 BW, althans"
Result shoud be: "artikel 7:625 BW" and " artikel 7:623 BW"
The syntax for the analyzer is:
"pattern": "(art.*?BW)",
"type": "pattern"
But in stead of the two phrases it returns all the text except the phrase,
using the phrases as delimiter.
Wat do I need to do to get only the two phrases returned for this analyzer?
Apache, Apache Lucene, Apache Hadoop, Hadoop, HDFS and the yellow elephant
logo are trademarks of the
Apache Software Foundation
in the United States and/or other countries.