3일 걸리던 일을 순식간에… 토종벤처 해냈다

빅데이터는 단순히 큰 데이터가 아니라 크고 많고 빠르고 복잡한 형태를 지닌 데이터를 말한다. 전에는 대부분 그냥 흘려보내거나 쌓아두기만 했다. 그러나 분석 기술의 발달로 정형이든 비정형이든 분석이 가능해졌고 서로 엮어 실시간으로 분석할 수 있는 플랫폼도 등장하고 있다.

빅데이터를 분석하기 시작하자 지금까지 발견하지 못했던 새로운 패턴이 드러나고 있다. 그 속에 다양한 의미가 내포돼 있다는 것을 알게 됐다. 데이터의 패턴 속에서 비즈니스에 필요한 인사이트를 얻을 뿐 아니라 데이터를 다루는 데 있어 보다 완벽한 보안체계를 구축할 수 있게 됐고 비용절감과 생산성 향상이 이뤄졌다.

이디엄(대표 양봉열)은 빅데이터 이슈와 함께 부상한 기업이다. 이디엄의 실시간 빅데이터 분석 시스템 `로그프레소'(LOGPRESSO)는 대용량 비정형 데이터를 실시간 수집ㆍ검색ㆍ분석ㆍ시각화해 기업의 의사결정을 돕는다.

이디엄은 지난 4월 쟁쟁한 외산을 물리치고 국내 L통신사가 발주한 실시간 서비스품질 모니터링 시스템의 빅데이터 분석 엔진 구축 사업자로 선정돼 업계를 놀라게 했다. 설립 1년밖에 안 된 신생벤처가 외산이 장악한 국내 빅데이터 검색솔루션 시장에, 그것도 통신3사 중 한 곳에 검색엔진을 제공함으로써 파장을 몰고 온 것이다.

이디엄은 최근 금융권 이상금융거래탐지시스템(FDS) 성능 업그레이드 BMT에서도 잇따라 수위를 차지했다. 금융권 FDS에서는 로그를 모두 모을 수 있어야 하고 실시간 행위를 들여다볼 수 있는 룰(rule) 엔진이 필요하다. 로그프레소는 이를 만족시킴으로써 현재 M, D 증권사와 도입 협상을 진행 중이다.

이디엄의 로그프레소가 승승장구하는 요인은 제품력이 뛰어나기 때문이다. 로그프레소는 데이터의 수집에서부터 유의미한 정보도출에 이르기까지 데이터의 전체 생명주기를 아우르는 모든 기능을 통합해 제공한다. 로그프레소를 도입하면 즉각 빅데이터 분석에 들어갈 수 있다. 기능이 통합돼 있고 기존 시스템과 뛰어난 호환성을 갖기 때문이다.

통신사에 엔진을 공급할 수 있었던 데는 외산 솔루션에 비해 5배 이상 빠른 데이터 분류 및 검색, 분석 능력이 작용했다. 로그프레소는 3일 이상 걸리던 분석시간을 초단위로 획기적으로 단축했다. 실시간 통신데이터 검색 및 분석이 가능해진 것이다.

빅데이터 분석을 위해서는 다양한 조건이 요구된다. 유닉스 윈도 등 상용서버 운영체제, 스위치 라우터 방화벽 IPS 등 네트워크, RDBS(관계형 데이터베이스) 등의 데이터와 웹 및 웹 앱 서버와 보안 및 응용프로그램의 로그 수집이 필요하다. 데이터 파싱(parsing) 및 정규화 등 다양한 포맷 처리도 능란해야 하고 수천만 건 이상의 방대한 대용량 로그를 고속으로 압축 전송하고 저장해야 한다. 여기에 개인정보 등 암호화와 데이터 위ㆍ변조 탐지, 실시간 풀 텍스트 검색과 데이터 분석 능력이 붙어야 한다.

이에 대한 해법으로서 이디엄의 로그프레소는 다수의 표준 프로토콜 및 에이전트를 지원하고 내장 파서(parser, 프로그램 구문 해석 알고리즘) 및 쿼리를 이용한 정규화를 채택했다. 국내외 대부분의 보안 솔루션과 장비의 로그 포맷에 대한 파서도 내장했다. 원본 대비 10% 크기의 에이전트 실시간 압축 전송을 지원하고 초당 80만 건의 고속 데이터를 저장할 수 있다. 임시 파일 생성 없이 실시간 암호화하고 무결성 검사도 지원한다. 실시간 풀텍스트 검색을 위해 다양한 인덱스 내장 방식을 취한다.

스트림 분석은 경쟁 제품이 따라오지 못하는 로그프레소만의 강점이다. 이벤트 컨텍스트 함수를 이용한 인 메모리 이벤트 연관 분석과 스트림 쿼리를 통한 실시간 스트리밍 데이터 분석은 폭증하는 미래 빅데이터 환경에 대비해 개발했다.

이러한 기술력과 스펙은 통합보안관제와 통합로그관리 솔루션 시장에서 로그프레소가 부상하는 배경이 됐다. 다양한 표준 프로토콜 지원은 물론, 예약된 쿼리를 통해 실시간 및 배치 ETL(데이터 추출 변환 적재)를 지원한다. 관계형 데이터베이스 데이터를 조합 분석하는 유연성도 뛰어나다. 운영관제에 필수적인 대시보드 구성을 손쉽게 하는 사용자 정의 대시보드 기능도 탁월하다. 하둡(HDFS)과 연동해 사용할 수 있으므로 하둡으로 수집한 데이터를 로그프레소를 이용해 추가적인 분석과 시각화를 수행한다. 로그프레소는 경찰청 도로교통공단 등 공공, 금융결제원 등 금융, L통신사 등 통신과 병원, 일반기업에 고른 레퍼런스를 확보하고 있다.

이규화선임기자 david@

http://www.dt.co.kr/contents.html?article_no=2014062402011375660001

둘러보기

더보기

실시간 데이터 분석 솔루션 시장 ‘태동’

사물인터넷(IoT) 시대를 맞아 빅데이터 속에서 실시간으로 인사이트를 얻기 위해 다양한 방법이 강구되고 있다. 6일 본지 취재 결과 최근 관련업계에서는 서로 연결된 각종 기계로부터 쏟아지고 있는(machine-generated) 데이터에 대한 관심이 점차 늘어나고 있다. IDC는 오는 2018년까지 IoT에서 생성된 데이터의 40%가 보관되고 프로세스를 거쳐 분석될 것으로 예상하고 있다. 빅데이터가 IoT와 결합하면서 폭넓은 분야에서 데이터 분석과 활용이 보편화될 것으로 전망된다. 이에 따라 보다 빠르고 명확한 의사결정으로 경쟁에서 앞서기 위해 ‘실시간 분석’에 대한 니즈도 급증하고 있다. ‘온라인 분석’은 데이터의 생성 시점과 분석 시점의 구분이 없는 반면, ‘실시간 분석’은 데이터가 생성되는 시점에 최대한 가깝게 분석이 함께 이뤄진다. 수많은 센서나 소셜미디어에서 생성되는 시계열(time series) 데이터를 그 대상으로 하며, 특히 각종 기계로부터 생성되는 로그데이터가 주재료가 되고 있다. 소프트웨어(SW) 벤더들은 ‘빅데이터’와 ‘실시간’이라는 두 축을 모두 지원하기 위해 다양한 형태의 솔루션을 선보이며 이 새로운 시장을 공략하고 있다. 공통적으로 빠른 색인(indexing)을 지원하며, 크게 컬럼형 데이터베이스관리시스템(DBMS)에서 파생된 유형과 로그처리시스템에서 발전된 유형으로 구분할 수 있다. 컬럼형DBMS에서 파생된 유형의 경우 DML(데이터조작언어) 가운데 수정(update)과 삭제(delete)를 지원하지 않는 대신 입력(insert)과 검색(select)을 위한 성능을 극대화시키는 등의 방식을 취한다. 로그처리시스템에서 발전된 유형의 경우 NoSQL DB처럼 스키마(schema)를 고정하지 않고 로(raw)데이터 자체를 실시간 인덱싱하고 향후 분석 대상을 재정의하는 스키마리스(schema-less) 형태로 저장한다. 컬럼형DBMS에서 파생된 솔루션으로는 ▲파스트림 ▲아이리스DB ▲인피니플럭스 등을 들 수 있고, 로그처리시스템에서 발전된 솔루션으로는 ▲스플렁크 ▲테라스트림 바스 ▲로그프레소 ▲D2 등을 꼽을 수 있다. <이하 상세 내용 컴퓨터월드 9월호 참조> [http://www.itdaily.kr/news/articleView.html?idxno=68478](http://www.itdaily.kr/news/articleView.html?idxno=68478)

2015-09-06

금융거래 이상징후 포착 `최적화`

개인정보유출과 해킹 등으로 금융사고가 빈발하면서 금융권의 이상거래탐지시스템(FDS) 구축 필요성이 높아지고 있다. 금감원은 현재 각 금융사가 연내에 FDS를 구축할 것을 독려하고 있다. 컴플라이언스로 강제되는 것은 아니지만, 금융사고 발생 시 FDS 미비 금융사에게는 가중 처벌이 가해지기 때문에 은행, 카드, 증권, 보험별로 FDS 구축을 서두르고 있다. 빅데이터 기반 실시간 로그분석 솔루션 기업 데이터밸류(공동대표 김형석, 이재학)는 최근 '로그세이'(LogSay)라는 금융거래 이상 징후 탐지 시스템을 선보였다. 이상 거래 징후 포착에는 빅데이터를 얼마나 신속하고 유효하게 분석할 수 있느냐가 관건인데, 로그세이는 초당 100만 건 아카이빙, 초당 50만 건의 웹로그 인덱싱, 초당 1만 건 이상의 이상 거래 분석 능력을 보유하고 있다. 로그세이는 빅데이터 분석 엔진 개발 기업 이디엄(대표 양봉열)의 로그 분석 엔진 '로그프레소'를 탑재하고 있다. 로그프레소는 순수 국내기술로 개발된 실시간 빅데이터 분석 엔진으로서 이미 국내 이통사에 공급돼 대용량 로그 분석의 역할을 성공적으로 수행하고 있는 시스템이다. 로그세이는 이상 거래 탐지와 관련한 금감원 컴플라이언스를 충족한다. 또한 고객별 커스터마이징과 단시간 포팅, 손쉽고 단순한 UI로 차별화를 꾀하고 있다. 시스템 내에 개인정보보호, 내부 정보유출 탐지, 암호화 기능이 탑재돼 레거시 시스템과의 연동에도 유리하다. 이재학 대표는 "현재 은행들과 BMT를 진행하고 있다"며 "은행들이 사내 개발 또는 아웃소싱 두 갈래로 진행하고 있는데, 어떤 방향이든 은행 거래의 속성과 보안에 대한 인사이트를 갖춘 컨설팅과 조언은 필요하다"고 말했다. 그는 "로그세이는 금융 보안에 대한 오랜 경험을 가진 전산 인력과 로그 분석 및 검색 분야 국내 최고 기술진이 협력해 만든 제품으로서, 금융시스템의 모든 채널을 이용하는 금융거래 정보를 수집, 분석할 수 있다"고 강조했다. 특히 로그세이가 강조하는 강점은 금융권 전문가를 통한 룰(rule) 발굴과 룰에 기반한 룰 엔진 개발 및 탑재로서, 업무 적용에 있어서 최적화를 이뤘다는 평가를 받고 있다. 데이터밸류는 하반기 은행과 증권사를 중심으로 FDS 구축 수요가 증가할 것에 대비해 BMT를 늘리고 고객사 상황에 맞는 최적화 구성전략을 전개하고 있다. 이규화 선임기자 david@ [http://www.dt.co.kr/contents.html?article_no=2014080502101352660002](http://www.dt.co.kr/contents.html?article_no=2014080502101352660002)

2014-08-04

토종 빅데이터 검색솔루션 외산 제쳐

빅데이터에 대한 관심이 고조되는 가운데 국내 통신사가 처음 추진한 실시간 빅데이터 사업에 토종 스타트업 검색솔루션이 선정됐다. 외산 일색인 국내 빅데이터 검색솔루션 시장에 변화를 몰고 올 전망이다. 이디엄(대표 양봉열 www.eediom.com)은 국내 대형 통신업체 L사가 발주한 실시간 서비스품질·모니터링 시스템 구축사업에 자사 검색엔진 ‘로그프레소’가 선정됐다고 6일 밝혔다. ‘로그프레소’는 비정형 빅데이터를 실시간으로 분석하는 SW로 이디엄은 이달까지 솔루션 구축작업을 마칠 예정이다. 이 프로젝트는 국내 통신사가 추진한 최초 빅데이터 프로젝트다. L사는 실시간 서비스 품질 모니터링 용도로 ‘로그프레소’를 도입·사용할 계획이다. 통신부야 빅데이터 솔루션시장 확대를 예고하는 사업 수주전에는 글로벌 검색엔진 업체도 뛰어들었다. 구동언 이디엄 운영이사는 “기존 출시된 외산 솔루션에 비해 다섯 배 정도 빠른 속도로 데이터를 읽고 분류하는 게 로그프레소의 강점”이라며 “이번 사업 수주로 대량 정보가 쌓이는 통신 분야 추가 프로젝트 수주도 기대된다”고 말했다. 로그프레소의 우수한 성능은 정평이 나 있다. 빅데이터 솔루션에서 하루 이상 걸리던 빅데이터 분석을 수분내로 단축시켰다. 초당 수십만건이 쏟아지는 환경에서도 이상 징후나 특정 이벤트를 찾는 등 다양한 이벤트 실시간 분석이 가능하다. 특히 지난해 3월 설립한 신생 스타트업 이디엄이 글로벌 솔루션을 제치고 프로젝트를 수주해 주목된다. 이디엄은 불과 1년 새 정부통합전산센터, 경찰청, 병무청 등 공공기관을 비롯해 SK텔레콤, 농협생명 등 20곳에 자사 솔루션을 공급하며 시장을 선도하고 있다. 이디엄은 최근 기능과 성능을 대폭 개선한 빅데이터 분석SW ‘로그프레소 엔터프라이즈 2’를 발표했다. 널리 쓰이는 빅데이터 플랫폼 하둡과의 연동을 강화한 제품이다. 양봉열 대표는 “많은 기업들이 빅데이터 분석 용도로 하둡을 도입했고 다양한 분야에서 실시간 빅데이터 분석을 요구한다”며 “하둡 플랫폼에 ‘로그프레소’만 추가하면 실시간과 배치 처리를 동시에 만족시킨다”고 설명했다. 이디엄은 서울대학교 컴퓨터공학과 출신 양봉열 대표가 동료 2명과 함께 2013년 3월에 설립한 빅데이터 처리 전문 스타트업이다. 이디엄 임직원 수는 13명이며 올해 매출 30억원을 목표로 하고 있다. [https://www.etnews.com/20140404000083](https://www.etnews.com/20140404000083)

2014-04-07