强烈建议智能更新采用保守原则

snowflurry · 发表于 2014-11-20 16:57:23

感觉3.0.2的智能更新比2.x版已经改进了不少，但是鉴于1.该功能理论上永远无法达到100%的正确识别率（考虑到数据库的限制）2.更新出错的话手动处理起来非常非常麻烦，强烈建议智能更新采用“宁可漏更一千，不可错更一个”的保守思路进行设计。

具体建议：
1. pdf识别，最好能增加固定以pdf文件名作为题录标题的选项给用户
我下载的很多会议文章和arXiv上面的文章，pdf拖进NE之后标题识别都是错的，更别说下一步更新了。但其实我的pdf文件名都是文章标题，有这种习惯的用户应该不少吧。
2. 智能更新，更新后的标题必须与更新前完全一致（大小写、标点符号和个别特殊字符除外），否则就认为更新失败
这个不用说了吧，更完之后连标题都变了，这更新能靠谱吗？？

这两个很合理吧。而且实现起来也不是太难吧。

给个例子：
http://www.eurasip.org/Proceedin ... pers/1569922141.pdf
这篇文章标题是“Graph Empirical Mode Decomposition”
pdf拖进NE之后标题识别为“CNRS, Ecole Normale Sup´erieure de Lyon, Physics Laboratory Lyon, France”，智能更新失败
手动把标题改正确，再进行智能更新，更新之后标题变为“View-Dependent Multiscale Fluid Simulation”，跟原文风马牛不相及
即便从IEEE Xplore数据库自动更新获得了所有正确信息之后，再进行智能更新仍然变为上面的错误结果

方便的话可以将该例子转给相关工程师进行测试。我的NE版本是3.0.2.6367，配置文件为目前最新。

NE-PM · 发表于 2014-11-20 18:04:04

我们设计智能更新的思路，就是按照您说的保守方式设计的。
出现您文中所说的现象，应该是极个别的文章造成的影响，我们会在后续的版本中持续改进！
请您继续关注NE！感谢！

snowflurry · 发表于 2014-11-20 19:29:53

NE-PM 发表于 2014-11-20 18:04
我们设计智能更新的思路，就是按照您说的保守方式设计的。
出现您文中所说的现象，应该是极个别的文章造成 ...

谢谢。可能在你们的测试范围里是极个别，但我经常遇到。照理说，设计得当的话第2个问题在任何情况下都不应该出现，更新前后标题里没有一个单词是一样的，这怎么能够认定为匹配呢？一个简单的检查不就可以避免这类情况了吗。

aegeansupport · 发表于 2014-11-20 20:27:21

snowflurry 发表于 2014-11-20 19:29
谢谢。可能在你们的测试范围里是极个别，但我经常遇到。照理说，设计得当的话第2个问题在任何情况下都不 ...

我们按照您的例子复原了您的操作步骤，经分析确认识别算法还有优化提升空间，我们会在后续版本中优化！非常感谢！

snowflurry · 发表于 2014-11-20 20:36:40

aegeansupport 发表于 2014-11-20 20:27
我们按照您的例子复原了您的操作步骤，经分析确认识别算法还有优化提升空间，我们会在后续版本中优化！非 ...

非常感谢！祝好

iandros · 发表于 2014-11-27 20:07:22

是的，这个情况太多了。甚至我都已经将pdf标示为“书”了，智能更新时竟然还按照期刊来更新，作者名、标题名全部都更改了，太让人抓狂了。本来用软件是为了提高效率，这倒好，还带来了额外的麻烦

iandros · 发表于 2014-11-27 20:26:15

刚刚下载了一个NF，发现就没有设置默认自动更新功能，难道别人能做的到，ne就做不到？应该不是什么难事，希望NE能够重视大家的意见

		自动登录	找回密码
密码			立即注册