|
感觉3.0.2的智能更新比2.x版已经改进了不少,但是鉴于1.该功能理论上永远无法达到100%的正确识别率(考虑到数据库的限制)2.更新出错的话手动处理起来非常非常麻烦,强烈建议智能更新采用“宁可漏更一千,不可错更一个”的保守思路进行设计。
具体建议:
1. pdf识别,最好能增加固定以pdf文件名作为题录标题的选项给用户
我下载的很多会议文章和arXiv上面的文章,pdf拖进NE之后标题识别都是错的,更别说下一步更新了。但其实我的pdf文件名都是文章标题,有这种习惯的用户应该不少吧。
2. 智能更新,更新后的标题必须与更新前完全一致(大小写、标点符号和个别特殊字符除外),否则就认为更新失败
这个不用说了吧,更完之后连标题都变了,这更新能靠谱吗??
这两个很合理吧。而且实现起来也不是太难吧。
给个例子:
http://www.eurasip.org/Proceedin ... pers/1569922141.pdf
这篇文章标题是“Graph Empirical Mode Decomposition”
pdf拖进NE之后标题识别为“CNRS, Ecole Normale Sup´erieure de Lyon, Physics Laboratory Lyon, France”,智能更新失败
手动把标题改正确,再进行智能更新,更新之后标题变为“View-Dependent Multiscale Fluid Simulation”,跟原文风马牛不相及
即便从IEEE Xplore数据库自动更新获得了所有正确信息之后,再进行智能更新仍然变为上面的错误结果
方便的话可以将该例子转给相关工程师进行测试。我的NE版本是3.0.2.6367,配置文件为目前最新。
|
|