见微投资:和你谈一谈搜索那些事儿

-回复 -浏览
楼主 2019-12-01 14:08:40
举报 只看此人 收藏本贴 楼主

各位金融投资达人们大家好,我是见微君,欢迎大家关注见微投资,见微投资是见微数据的官方订阅号,将会在未来向广大一级,二级投资者提供深度市场洞察,案例研究和金融分析等高品质内容,鉴于今天是见微投资的第一篇软文,干货肯定是不能少的,于是见微君请到了公司大拿攻城狮小杜,来跟我们聊一聊见微数据搜索的那些事儿。

谢谢见微君,在进入正题之前,先向大家简单地介绍一下见微数据,见微数据是一款专业金融信息检索的产品,为用户提供针对沪深、三板、港股和美股公司高效、便捷的公告全文检索服务,您可以访问www.factminr.com进行使用。


今天是见微数据上线的第二天,想就今天的这个机会给大家推广我们新产品的同时,也跟大家分享一下见微数据里那些关于“搜索”的故事。

对于资本市场的各位朋友来说,搜索引擎并不是一个陌生的概念。每天我们都在各种场景下使用搜索引擎,无论是用百度/Bing/Google的通用搜索,还是通过微博/点评/知乎的站内搜索。“一搜即得”似乎理所当然,但聪明如你,真的了解搜索引擎是如何从海量信息中定位到我们想要的信息的吗?

假设这样一个场景:小明是一名大学老师,要批改学生的期末试卷。小红收到成绩之后觉得和她预想的不一样,找到小明要求查阅试卷,小明看小红态度诚恳决定给她一个机会,于是找出了一摞两百张卷子让她找出自己的。那么问题来了,小红怎么快速找到自己的试卷?

当然是一篇一篇翻啦。

小红同学选择了错误的查阅方向,找到最后一篇才是她的卷子,而且小明拒绝给她调整分数。这种按照某种顺序一个一个查找的方法,在数据库上称为“全表扫描”,是一种非常耗费资源和时间的查找方法。它的问题在于,随着表/文档集的规模膨胀,查询的时间也线性甚至非线性增长。海量文档中查找,当然也就需要海量的时间才能完成。

我们再来看下一个场景:小白是一名正在学习中文的外国人,随堂测验中,小明出题让小白用“见微知著”造一个句子,而小白却连它是什么意思都不知道。小白手边只有一本《现代汉语词典》,那么问题来了,他应该如何快速找到这个词的释义?


机智的小白,当然不会从词典的第一页开始翻。

他打开了词典的目录页,按照拼音或者偏旁部首先定位到了“见”这个字,找到对应的页码,然后翻了几页就找到了“见微知著”这个词项。这里的拼音或者偏旁部首的目录,我们称之为“索引”。索引抽取了文档的特征信息,在这里是词语的首字信息,并且记录了对应文档的位置。当我们给定某个具体特征(关键字、日期、类别等等)的时候,就可以迅速通过索引找到对应的文档。

回到资本市场的场景中来,在我们每天撰写各种pitchbook/备忘录/意见书/研究报告的时候,如果要找一些相关的信息,我们通常是如何操作的?

最好的情况是,我们知道是这个信息是包含在哪个上市公司发的公告里的,这个公告是在哪一天发的;而最坏的情况则是,我可能只是脑海里有几个关键字,根本不知道这些信息在公告里是否有提及,在哪些公告里有提及。我或许有个大致的范围,于是只能下载一堆PDF版的招股书一篇一篇浏览——人肉方式的“全表扫描”。难道每分每秒都是真金白银的我们就要囿于这种落后的生产方式吗?

当然不会。

见微数据所做的事情,就是给上市公司公告建立了一个索引。你可以理解为它是一种复合层次的索引,不光从关键字可以定位到文档,也可以从公司、日期、行业或者其他特征定位到文档,就好比一个字的拼音、偏旁部首、笔画那样。我们用后台的时间、空间(和钱)建立和维护这个庞大的索引,从而使得用户在查询时能够节省更多的时间,更便捷地找到有价值的信息。

譬如您做投资相关,可以从三板中检索出和“充电宝”相关的公司公告:

又譬如您做投行业务,可能需要了解补充流动资金的测算方法:

再譬如您只是八卦路人一枚,想在A股中搜索“白百何”:

限于篇幅原因,这里先举了几个简单的例子。未来我们会在这个栏目下推出更多资本市场中检索应用的使用场景和案例,也希望您能够亲身体验。跟见微数据搜索的故事就先讲到这,最后我们非常欢迎大家来踊跃注册并体验我们的产品:见微数据!

谢谢各位看官与我们的大拿攻城狮小杜,目前见微数据已经开放注册,您可以访问www.factminr.com进行使用,我们期待您的使用心得和反馈,下一期我们再会!

见微数据服务

您身边的金融数据管家


我要推荐
转发到

友情链接