3일 걸리던 일을 순식간에… 토종벤처 해냈다

빅데이터는 단순히 큰 데이터가 아니라 크고 많고 빠르고 복잡한 형태를 지닌 데이터를 말한다. 전에는 대부분 그냥 흘려보내거나 쌓아두기만 했다. 그러나 분석 기술의 발달로 정형이든 비정형이든 분석이 가능해졌고 서로 엮어 실시간으로 분석할 수 있는 플랫폼도 등장하고 있다.

빅데이터를 분석하기 시작하자 지금까지 발견하지 못했던 새로운 패턴이 드러나고 있다. 그 속에 다양한 의미가 내포돼 있다는 것을 알게 됐다. 데이터의 패턴 속에서 비즈니스에 필요한 인사이트를 얻을 뿐 아니라 데이터를 다루는 데 있어 보다 완벽한 보안체계를 구축할 수 있게 됐고 비용절감과 생산성 향상이 이뤄졌다.

이디엄(대표 양봉열)은 빅데이터 이슈와 함께 부상한 기업이다. 이디엄의 실시간 빅데이터 분석 시스템 `로그프레소'(LOGPRESSO)는 대용량 비정형 데이터를 실시간 수집ㆍ검색ㆍ분석ㆍ시각화해 기업의 의사결정을 돕는다.

이디엄은 지난 4월 쟁쟁한 외산을 물리치고 국내 L통신사가 발주한 실시간 서비스품질 모니터링 시스템의 빅데이터 분석 엔진 구축 사업자로 선정돼 업계를 놀라게 했다. 설립 1년밖에 안 된 신생벤처가 외산이 장악한 국내 빅데이터 검색솔루션 시장에, 그것도 통신3사 중 한 곳에 검색엔진을 제공함으로써 파장을 몰고 온 것이다.

이디엄은 최근 금융권 이상금융거래탐지시스템(FDS) 성능 업그레이드 BMT에서도 잇따라 수위를 차지했다. 금융권 FDS에서는 로그를 모두 모을 수 있어야 하고 실시간 행위를 들여다볼 수 있는 룰(rule) 엔진이 필요하다. 로그프레소는 이를 만족시킴으로써 현재 M, D 증권사와 도입 협상을 진행 중이다.

이디엄의 로그프레소가 승승장구하는 요인은 제품력이 뛰어나기 때문이다. 로그프레소는 데이터의 수집에서부터 유의미한 정보도출에 이르기까지 데이터의 전체 생명주기를 아우르는 모든 기능을 통합해 제공한다. 로그프레소를 도입하면 즉각 빅데이터 분석에 들어갈 수 있다. 기능이 통합돼 있고 기존 시스템과 뛰어난 호환성을 갖기 때문이다.

통신사에 엔진을 공급할 수 있었던 데는 외산 솔루션에 비해 5배 이상 빠른 데이터 분류 및 검색, 분석 능력이 작용했다. 로그프레소는 3일 이상 걸리던 분석시간을 초단위로 획기적으로 단축했다. 실시간 통신데이터 검색 및 분석이 가능해진 것이다.

빅데이터 분석을 위해서는 다양한 조건이 요구된다. 유닉스 윈도 등 상용서버 운영체제, 스위치 라우터 방화벽 IPS 등 네트워크, RDBS(관계형 데이터베이스) 등의 데이터와 웹 및 웹 앱 서버와 보안 및 응용프로그램의 로그 수집이 필요하다. 데이터 파싱(parsing) 및 정규화 등 다양한 포맷 처리도 능란해야 하고 수천만 건 이상의 방대한 대용량 로그를 고속으로 압축 전송하고 저장해야 한다. 여기에 개인정보 등 암호화와 데이터 위ㆍ변조 탐지, 실시간 풀 텍스트 검색과 데이터 분석 능력이 붙어야 한다.

이에 대한 해법으로서 이디엄의 로그프레소는 다수의 표준 프로토콜 및 에이전트를 지원하고 내장 파서(parser, 프로그램 구문 해석 알고리즘) 및 쿼리를 이용한 정규화를 채택했다. 국내외 대부분의 보안 솔루션과 장비의 로그 포맷에 대한 파서도 내장했다. 원본 대비 10% 크기의 에이전트 실시간 압축 전송을 지원하고 초당 80만 건의 고속 데이터를 저장할 수 있다. 임시 파일 생성 없이 실시간 암호화하고 무결성 검사도 지원한다. 실시간 풀텍스트 검색을 위해 다양한 인덱스 내장 방식을 취한다.

스트림 분석은 경쟁 제품이 따라오지 못하는 로그프레소만의 강점이다. 이벤트 컨텍스트 함수를 이용한 인 메모리 이벤트 연관 분석과 스트림 쿼리를 통한 실시간 스트리밍 데이터 분석은 폭증하는 미래 빅데이터 환경에 대비해 개발했다.

이러한 기술력과 스펙은 통합보안관제와 통합로그관리 솔루션 시장에서 로그프레소가 부상하는 배경이 됐다. 다양한 표준 프로토콜 지원은 물론, 예약된 쿼리를 통해 실시간 및 배치 ETL(데이터 추출 변환 적재)를 지원한다. 관계형 데이터베이스 데이터를 조합 분석하는 유연성도 뛰어나다. 운영관제에 필수적인 대시보드 구성을 손쉽게 하는 사용자 정의 대시보드 기능도 탁월하다. 하둡(HDFS)과 연동해 사용할 수 있으므로 하둡으로 수집한 데이터를 로그프레소를 이용해 추가적인 분석과 시각화를 수행한다. 로그프레소는 경찰청 도로교통공단 등 공공, 금융결제원 등 금융, L통신사 등 통신과 병원, 일반기업에 고른 레퍼런스를 확보하고 있다.

이규화선임기자 david@

http://www.dt.co.kr/contents.html?article_no=2014062402011375660001

둘러보기

더보기

빅데이터 기술, 보안시장에서 '각광'

보안 영역이 빅데이터 기업의 '기회의 장'으로 부상하고 있다. 사이버 공격 고도화로 기존 보안 솔루션으로 대응이 어려워지면서 '빅데이터 기술'이 대안으로 떠오르고 있다. 26일 업계에 따르면 기업·공공기관의 빅데이터 기술 적용 보안사업 발주가 이어지면서 빅데이터 기업들이 보안시장 공략에 박차를 가하고 있다. 특히 정부통합전센산터가 발주한 '빅데이터를 활용한 통합자료분석시스템 구축사업'과 같이 보안 사업에 직간접적으로 빅데이터 기술 적용을 요구하는 사례가 늘면서 기업들 움직임이 빨라졌다. 보안 시장에서 빅데이터 기술이 주목 받는 것은 전통적인 시그니처(알려진 위협) 방식 보안 솔루션으로는 지능형지속위협(ATP)과 같은 새로운 형태의 공격을 방어할 수 없기 때문이다. 빅데이터 기술을 활용하면 과거에는 몰랐던 공격 패턴을 분석해 대응할 수 있다. 가트너는 최근 보고서에서 “빅데이터를 활용한 보안 분석으로 종전 볼 수 없었던 패턴을 발견하고 경영을 위한 통찰력을 얻을 수 있다”고 평가했다. 국내 기업 중에는 KT넥스알이 가장 활발하다. 기업의 보안 솔루션 로그 데이터를 빅데이터 플랫폼에 통합·수집·저장·분석해 새로운 공격에 대응하는 'NDAP 포 시큐리티(NDAP for Security)'를 출시했으며 최근 한 대기업에 구축을 완료했다. 관계형 데이터베이스 관리시스템(RDMBS) 기반 통합보안관리(ESM) 시스템을 운용하던 이 대기업은 제품을 도입해 기존 파악이 어려웠던 새로운 보안 취약점을 분석하고 사고를 예방할 수 있게 됐다. KT넥스알 관계자는 “보안 시장에서 빅데이터 기술 도입이 필요하다는 공감대가 형성되는 상황”이라며 “여러 기업과 제품 보급을 위한 논의를 하고 있다”고 말했다. 더존정보보호서비스·KCC시큐리티·SGA·이디엄 등도 빅데이터 보안 사업에 박차를 가하고 있다. 더존정보보호서비스는 스플렁크의 빅데이터 엔진을 적용한 '아르고스 센티넬'을 출시했다. KCC시큐리티는 빅데이터를 이용한 보안관제 기술 특허를 획득했다. 대용량 데이터를 효율적으로 분석해 분산서비스거부(DDoS), APT 등의 공격을 효과적으로 탐지하는 기술이다. SGA는 국가과제로 빅데이터 기반 APT 공격 탐지 기술을 개발 중이다. 연내 출시 예정인 빅데이터 기반 통합보안관제솔루션에 기술을 적용할 방침이다. 이디엄은 빅데이터 엔진 로그프레소를 출시해 통합보안관제시스템 시장을 공략하고 있다. 해외 기업 중에는 스플렁크, 블루코트 등이 관련 사업에 박차를 가하고 있다. 양봉열 이디엄 대표는 “정부통합전산센터, 교육청 등 통합관제사업 발주 시 빅데이터 기술 도입을 요구하는 기관이 늘고 있다”며 “보안 부문은 특히 실시간 대응이 중요한 만큼 빅데이터 기술이 유용하게 활용될 수 있을 것”이라고 말했다. [전자신문 - 빅데이터 기술, 보안시장에서 '각광'](https://www.etnews.com/201308260565)

2013-08-26

“스플렁크 게 섯거라”…청년 벤처의 도전

어느 날 우연히 국내 벤처 업체 중 하나가 스플렁크에 대적할 솔루션을 개발했다는 이야기를 들었다. ‘이디엄’이라는 회사명과 ‘로그프레소’라는 제품명 모두 낯설었다. 전 세계 빅데이터 시장에서 각광을 받고 있는 스플렁크에 대적할 소프트웨어를 국내 벤처기업이 개발했다는 것은 궁금증을 자아내기에 충분했다. 수소문 해서 이디엄 양봉열 대표에게 연락을 취했다. 그런데 그는 이미 기자가 알고 있던 인물이었다. 4년 전 ‘벤처스토리’라는 기획 시리즈를 진행할 때 ‘엔초비’라는 보안관제 회사를 설립해 인터뷰를 했던 인물이었다. 그러나 20대 청년에게 보안 시장은 녹록치 않았나보다. 야심차게 시작했지만 많은 쓴 맛을 봐야 했다. 결국 보안관제 사업은 계획대로 성장하지 못했고, 퓨처시스템에 인수됐다. 양 대표는 그러다 올해 초 다시 독립했다. 보안관제를 위해 개발해 왔던 로그분석 기술을 발전시키면 빅데이터 시대에 괜찮은 솔루션을 개발할 수 있을 것이라는 생각 때문이었다. 로그를 다루는 기술은 엔초비 시절부터 개발해 온 것이었다. 보안 관제를 위해서는 보안로그를 분석해 위협을 파악해야 하기 때문이다. 하지만 당시에는 로그를 단순히 저장하고, 가져오는 기술만 보유하고 있었다. 여기에 인덱싱과 검색, 리포팅 등의 기능을 추가해 스플렁크와 같은 솔루션을 개발했다. 양 대표는 “처음에는 보안 장비에서 나오는 로그를 분석하기 위해 기술을 개발했는데, 빅데이터 시대가 도래하면서 센서네트워크를 비롯해 웹로그, 사용자행동로그 등 다양한 로그를 다 처리할 수 있도록 했다”고 설명했다. 양 대표는 ‘로그프레소’의 강점으로 보안성을 들었다. 처음에 보안업체로 시작했기 때문에 보안에 중점을 두고 개발했다는 설명이다. 그는 “스플렁크는 암호화를 내장해서 지원하지 않는다”면서 “로그프레소는 모든 데이터가 암화화 돼 저장되는 등 보안에 뛰어나다”고 강조했다. 또 하둡 등 외부 빅데이터 플랫폼과의 연동성도 뛰어나다고 설명했다. 양 대표는 “로그프레소는 자바로 개발된 플랫폼으로 하둡과 궁합이 잘 맞는다”면서 “실시간 분석은 로그프레스로, 배치 처리는 하둡으로 통합해 고도 분석을 할 수 있다”고 말했다. 하둡뿐 아니라 기존 관계형 DB의 데이터와도 연동할 수 있다고 그는 덧붙였다. 물론 그렇다고 당장 스플렁크보다 우수한 솔루션을 개발했다고 자신할 수는 없다. 현재로서는 분산처리가 지원되지 않고, 스플렁크의 가장 큰 장점으로 꼽히는 이용자 편의성도 부족한 편이다. 양 대표는 “당장 스플렁크를 대체할 수는 없다고 하더라도 스플렁크까지 도입할 필요가 없는 기업이나, 스플렁크가 지나치게 고가여서 도입하기 어려운 기업들도 많기 때문에 일단 이 시장을 공략할 예정”이라면서 “그러나 내년 초 현재 중비 중인 기능과 기술이 완성되면 정면대결도 가능할 것으로 보고 있다”고 말했다. [디지털데일리 심재석기자] [https://www.ddaily.co.kr/news/article/?no=111116](https://www.ddaily.co.kr/news/article/?no=111116)

2013-11-19

실시간 데이터 분석 솔루션 시장 ‘태동’

사물인터넷(IoT) 시대를 맞아 빅데이터 속에서 실시간으로 인사이트를 얻기 위해 다양한 방법이 강구되고 있다. 6일 본지 취재 결과 최근 관련업계에서는 서로 연결된 각종 기계로부터 쏟아지고 있는(machine-generated) 데이터에 대한 관심이 점차 늘어나고 있다. IDC는 오는 2018년까지 IoT에서 생성된 데이터의 40%가 보관되고 프로세스를 거쳐 분석될 것으로 예상하고 있다. 빅데이터가 IoT와 결합하면서 폭넓은 분야에서 데이터 분석과 활용이 보편화될 것으로 전망된다. 이에 따라 보다 빠르고 명확한 의사결정으로 경쟁에서 앞서기 위해 ‘실시간 분석’에 대한 니즈도 급증하고 있다. ‘온라인 분석’은 데이터의 생성 시점과 분석 시점의 구분이 없는 반면, ‘실시간 분석’은 데이터가 생성되는 시점에 최대한 가깝게 분석이 함께 이뤄진다. 수많은 센서나 소셜미디어에서 생성되는 시계열(time series) 데이터를 그 대상으로 하며, 특히 각종 기계로부터 생성되는 로그데이터가 주재료가 되고 있다. 소프트웨어(SW) 벤더들은 ‘빅데이터’와 ‘실시간’이라는 두 축을 모두 지원하기 위해 다양한 형태의 솔루션을 선보이며 이 새로운 시장을 공략하고 있다. 공통적으로 빠른 색인(indexing)을 지원하며, 크게 컬럼형 데이터베이스관리시스템(DBMS)에서 파생된 유형과 로그처리시스템에서 발전된 유형으로 구분할 수 있다. 컬럼형DBMS에서 파생된 유형의 경우 DML(데이터조작언어) 가운데 수정(update)과 삭제(delete)를 지원하지 않는 대신 입력(insert)과 검색(select)을 위한 성능을 극대화시키는 등의 방식을 취한다. 로그처리시스템에서 발전된 유형의 경우 NoSQL DB처럼 스키마(schema)를 고정하지 않고 로(raw)데이터 자체를 실시간 인덱싱하고 향후 분석 대상을 재정의하는 스키마리스(schema-less) 형태로 저장한다. 컬럼형DBMS에서 파생된 솔루션으로는 ▲파스트림 ▲아이리스DB ▲인피니플럭스 등을 들 수 있고, 로그처리시스템에서 발전된 솔루션으로는 ▲스플렁크 ▲테라스트림 바스 ▲로그프레소 ▲D2 등을 꼽을 수 있다. <이하 상세 내용 컴퓨터월드 9월호 참조> [http://www.itdaily.kr/news/articleView.html?idxno=68478](http://www.itdaily.kr/news/articleView.html?idxno=68478)

2015-09-06