머신러닝 시대에 금융 정보의 미래

본 글은 블룸버그 엔터프라이즈 데이터 대표인 제랄스 프란시스에 의해 작성되었습니다. 

  • 데이터 접근성과 다양성, 분절성 증가하면서 금융 정보가 투자 전략의 변화 이끌어
  • 머신러닝은 금융의 미래 동력…투자자에게 보다 빠르고 스마트하며 정확한 시장 인사이트 제
  • 즉각 가용한 데이터는 자동화, 새로운 트레이딩 전략, 시장 인텔리전스의 동인

금융 산업은 전례 없는 규모의 기술적 파괴(technological disruption)를 경험하고 있다. 이러한 빠른 변혁을 가능케 한 것은 데이터에 대한 접근성이다. 의사 결정권자가 접할 수 있는 데이터의 양과 복잡성 및 다양성은 최근 몇 년간 기하급수적으로 성장했고, 데이터의 분절 또한 심해졌다. IBM에 따르면 오늘날 전세계에 존재하는 데이터의 90%가 최근 2년간 생산되었다고 한다.데이터 (및 대안적 데이터), 머신러닝, 자연어 처리 등 세 가지 요소가 융합하여 전세계 자본시장의 투자자들이 접근 가능한 정보를 얻고 소비하며 분석하는 방식을 근원적으로 바꾸고 있다. 이 변화는 투자회사의 거래 전략과, 경영정보의 차별화를 꾀하는 방식 또한 다시금 변화시킨다.

데이터 처리의 어려움 다양성과 분절성

금융기관의 데이터 풀은 광대하지만 파편화되어 있다. 대부분의 사람들에게 익숙한 고전적 펀더멘털 데이터(재무 성과, 증권 가격 등) 뿐 아니라, 업무 프로세스(상업적 거래 등)를 통해 생성된 데이터, 기계 생성 데이터(위성 정보 등), 소셜 미디어 등 비전통적 출처의 데이터까지도 여기 포함된다.

투자자들 또한 후자의 대안적 데이터 세트로 눈을 돌림으로써, 새롭지만 관련성 높은 투자 신호를 찾는 데 특화된 신기법을 이용해 알파를 포착하려 노력하고 있다. 오늘날의 투자자는 주식 가격이나 재무 성과 뿐 아니라 위성 사진이나 공급망 정보, ESG 요소, 심지어 트윗까지도 해석해야 하는 상황이다.

대안 데이터가 투자 의사결정에 깊이를 더해줄 수는 있지만, 과거 데이터와 일반적인 식별자는 데이터를 해석하여 거래 계정이나 포트폴리오에 관련 있는 정보를 만드는 데 필수적인 맥락을 제공한다.

금융 산업에서는 막대한 분량의 데이터가 생성된다. 블룸버그는 하루 1천억 개의 시장 데이터 메시지를 수신하며, 12만 5천여 신규 출처로부터 매일 2백만 건의 새로운 기사를 입수한다. 머신러닝 알고리즘과 자연어 처리가 지원하는 당사의 예측 분석 도구는 이 모든 데이터를 걸러내어 가장 중요한 정보만을 투자자에게 전달해 준다.

오늘날 시장 참여자와 금융 기관에게 가장 큰 어려움은 이용할 데이터 세트를 어떻게 가려낼지, 그 데이터 세트가 일관성과 연결성, 즉각적인 가용성을 가진 고품질 데이터임을 어떻게 검증할지, 그리고 이를 어떻게 빠르게 해석하여 중요한 의사결정에 활용할 수 있을지 알아내는 일이다.

즉시 가용한 데이터로 자동화 촉진

데이터의 폭발적 증가 자체보다, 그로 인한 변화와 복잡성이 더욱 문제다. 당장 해결해야 하는 과제의 규모를 감안했을 때, 금융기관들이 데이터 관리 개선과 알파 창출을 위해 프로세스 자동화 기술을 찾는 것은 놀랍지 않다.

머신러닝은 이러한 기술 중 가장 빠르게 선두로 부상한 기술이다. 자연어 처리와 데이터 수집의 발전으로 전자 체결 플랫폼 상에서 거래 자동화가 촉진되었다. 회사들은 빅데이터와 머신러닝을 활용하여 고객 수요와 가격 변화를 예측하고 있다.

바이사이드 쪽에서는, 헤지펀드와 자산운용사들이 시장 유동성 기반 리스크 평가 시에 예측 분석(predictive analysis)을 활용하고 있다. 자동화되는 업무 흐름이 늘어나면서, 금융업계 종사자들은 전략과 포트폴리오의 선택, 투자 논거 개발 등을 포함한 인지적 측면에 보다 집중할 수 있다. 이러한 방법들을 활용하여 다양한 금융의 문제들을 해결하려는 시도가 이루어지고 있는데, 이를 통해 트레이딩과 고객향(Client-facing) 업무흐름 내에 보다 정교한 인텔리전스를 구축할 수 있기 때문이다.

최근 블룸버그에서 시드니, 싱가포르, 도쿄, 뭄바이 등 아시아태평양 지역 4개 도시에서 개최한 머신러닝 설명회(Machine Learning Decoded) 로드쇼 행사에서는 대부분의 금융업계 종사자들이 머신러닝을 단지 체결 전략을 최적화하여 거래 효율을 높이기 위해서 뿐 아니라, 신호와 요인들을 창출하기 위해 사용하고 있음이 드러났다. 이 시장들 중에서, 현재까지는 일본이 트레이딩 모델에 머신러닝을 도입하는 데 있어서 가장 앞서 있었으며, 투자 전략에서도 가장 다양한 범주의 데이터 세트를 활용하는 것으로 밝혀졌다.

이에 발맞추어 블룸버그에서는 머신러닝의 잠재력을 이해하기 위한 노력을 가속화하고 있다.

데이터 서비스화

머신러닝 시대에 금융 데이터와 정보는 보다 풍성해지면서  또한 보다 예측 가능하고 조직화된다. 선도적인 금융정보 기업으로서 블룸버그는 ‘정제된 형식(tidy formats)’으로 데이터를 표준화하고 있다. 이를 통해 표준화된 과거 이력 데이터를 제공하여 데이터의 효율성과 상호 참조성을 강화하여 데이터 분석을 용이하게 한다.

블룸버그의 새롭게 출시된 웹 기반 데이터 전달 플랫폼인 블룸버그 엔터프라이즈 액세스 포인트(BEAP)는 고객이 대량의 데이터 세트를 탐색하고 활용하여 쉽게 조작, 모델링 및 시각화할 수 있게 지원한다. 최근 BEAP에는 블룸버그 및 시장 선도적인 대안 데이터 제공사에서 제공되는 20개 이상의 대안적 비전통 데이터 세트가 추가되었으며, 여기에는 금속 재고 현황에 대한 통찰, 주식 블로거 심리, 의약품 승인, 주차장 활동, 건설 허가, 지정학적 리스크와 앱 활용 정보 등이 포함되어 있다.

고객은 또한 데이터를 자신의 애플리케이션 내에서 다양한 방식으로 사용하고 싶어하기 때문에, 블룸버그에서는 당사의 데이터를 언제 어디로든 전송할 수 있는 방법을 개발 중이다. 데이터는 곧 서비스화 될 것이며, 미래의 플랫폼은 보다 가볍고 이동성이 높아질 것이다.

머신러닝은 근본적으로 데이터 기반이며, 투자자가 매우 복잡한 관계를 빠르게 포착할 수 있도록 도와준다. 그럼으로써 기존에는 데이터 내의 상호작용의 복잡성, 문제의 복합성, 가용 데이터 부재 또는 연산 자원 부족 등의 문제로 다루기 불가능했던 문제에 투자자가 새롭게 접근할 수 있게 해 준다.

현재 사용 가능한 기법과 기술은 보다 정교해지고 있지만 이 모든 기술과 머신러닝 전략의 성공을 지원하기 위해 상호 연결되고 실행 가능한 고품질 데이터의 중요성이 점점 더 커지고 있다. 지금 이를 이해하고 데이터를 기반으로 한 기업 전략을 실행하는 회사가, 새로운 머신러닝 시대의 궁극적인 승자가 될 것이다.