k8凯发国际旗舰厅
  >  正文

明汯投资:非标准化数据的清洗处理是必要步骤-k8凯发国际旗舰厅

评论

  在明汯投资看来,数据是量化投资最重要的基础,数据过少则难以建模。在金融数据的海洋中,根据数据来源的不同,可以将其分为价量数据、基本面数据、事件驱动数据和另类数据。随着量化投资总体规模的上升,基于传统低频价量数据和基本面数据的量化投资赛道拥挤度提高,在国内仍属蓝海的另类数据被提及的频率在持续增加。明汯投资注意到,相较于传统的标准财务数据,另类数据更加多元,可来源于图形、文本、图像甚至是音视频文件,主要包括个人生产数据、商业过程数据和传感器数据等非标准化、待处理、无法直接使用的数据。

  明汯投资进一步指出,根据数据格式的不同,金融数据也可以分为标准化数据和非标准化数据两类。常见的标准化数据是截面、时间序列等数值类型数据,如交易所原始数据、原始行情及各类衍生出的价格、交易量、k线图等。普通投资者在炒股软件上看的分时图、k线图等数据也都衍生于交易所的原始数据,这些较为干净的数据被称为“标准化数据”。

  然而,非标准化数据以文本数据为主,包括财经新闻、财经论坛问答、卖方分析师投资报告、第三方机构提供的特殊数据等。这些数据里低相关非重大信息占比高,相比标准化数据会更复杂一些,所以被称为“非标准化数据”。明汯投资强调,为将其应用于量化策略开发,进行数据清洗等结构化处理是必要的步骤。

  明汯投资于2014年在上海创立,凭借强大的数据挖掘、统计分析和技术开发能力,构建起全周期、多品种、多策略的资产管理平台,目前管理规模位居行业前列。2020年,明汯投资在北美建立投研中心,吸收海外顶级量化机构投研人才,致力于为国内股票市场选股模型提供世界前沿的k8凯发国际旗舰厅的技术支持。

  从统计学的角度来看,基于历史数据预测未来市场的量化投资是可行的。经过十年的深耕细作,明汯投资已打造出一套高效且成熟的数据处理体系。在明汯投资看来,数据的结构化处理也可类比为样本的选择,其重要性不言而喻。“garbage in, garbage out.”样本选择的偏差将带来对总体认知的偏差。同理,未经过结构化处理的非标准化数据中存在的大量低相关、非重大的信息将直接影响最终投资决策的有效性,造成难以估量的损失。


责编:sq 


〖免责申明〗本文仅代表作者个人观点,其图片及内容k8凯发国际旗舰厅的版权仅归原所有者所有。如对该内容主张权益请来函或邮件告之,本网将迅速采取措施,否则与之相关的纠纷本网不承担任何责任。

经济发展网致力于信息传播并不代表本网赞同其观点和对其真实性负责,若有任何不当请联系k8凯发国际旗舰厅删除。

||k8凯发国际旗舰厅 copyright © 2018-2020 经济发展网 all rights reserved

经济发展协会联盟成员 食品药品监管总局投诉举报电话:12331

本网站展示资料或信息,仅供用户参考,不构成任何投资建议。

网站地图