Title: | H-sim: uma função de similaridade híbrida para identificação de correspondência de produtos |
Author: | Moreira, Higor |
Abstract: |
Uma empresa ao realizar compras de produtos de seus fornecedores, precisa importar as notas fiscais eletrônicas destes produtos para sua base de dados relacional para administrar o estoque de produtos, tributos e revenda. Esta não é uma tarefa trivial, pois as descrições dos produtos das notas fiscais e da base de dados apresentam variações. Este trabalho de conclusão de curso apresenta a função de similaridade H-sim que combina funções de similaridade semânticas com funções de similaridade baseadas em token ou distância de edição para identificar produtos correspondentes de diferentes bases de dados. Foram realizados experimentos utilizando dados reais de produtos, onde a função H-sim obteve 87,7% de F1. When a company purchases products from its suppliers, it needs to import electronic invoices for these products into its relational database to ma- nage product inventory, taxes and resale. This is not a trivial task, as the product descriptions in the invoices and the database vary. This paper presents the H- sim similarity function that combines semantic similarity functions with simila- rity functions based on token or edit distance to identify corresponding products from different databases. Experiments were performed using real product data, where the H-sim function obtained 87.7% of F1. |
URI: | https://dspace.ifrs.edu.br/xmlui/handle/123456789/1479 |
Date: | 2022 |
Files | Size | Format | View | Description |
---|---|---|---|---|
1234567891479.pdf | 993.1Kb |
View/ |
Texto completo |