[PASCON 2020] 양봉열 로그프레소 대표 “단일 빅데이터 플랫폼만이 안정적 보안 운영 담보”

데일리시큐 주최 하반기 최대 정보보안&개인정보보호 컨퍼런스 PASCON 2020이 11월 10일 더케이호텔서울 가야금홀에서 방역수칙 준수하에 성황리에 개최됐다.

이 자리에서 양봉열 로그프레소 대표는 ‘보안관제를 지탱하는 기술’이란 주제로 강연을 진행했다.

양봉열 대표는 2005년 인젠의 시큐플랫ESM으로 통합보안관제 시스템 개발을 시작한 이래, 15년 간 관제 기술을 연구해왔다.

초기 관제 시스템들은 관계형 데이터베이스와 ISAM 파일을 기반으로 설계되었다. 로그는 정규화해 ISAM 파일에 쓰고, 이벤트는 데이터베이스에 저장했다. 그러나 이런 데이터 시스템은 스키마가 고정되어 있어서 원본 로그를 저장하기 어려웠다. B-TREE 기반 스토리지 엔진은 잠금으로 인해 고속 쓰기에 불리했고, 트리 노드에 항상 여유 공간이 존재하기 때문에 디스크를 낭비하게 되고 압축하기에도 어려운 구조적 문제가 있었다.

엘라스틱과 하둡 양쪽으로 데이터 저장하는 땜질 처방…지금도 계속

당시에 부상하던 인메모리 DB를 비롯해 여러가지 대안들이 실험되었지만, 근본적으로 보안 로그의 특성을 염두에 두지 않은 OLTP 위주의 데이터 시스템은 성능 문제를 해결하기에 역부족이었다. 2010년 이전의 시스템은 성능 문제로 로그 수집, 저장부터 누수되는 경우가 빈번했고, 로그를 조회하거나 검색하면 저장 속도가 급격하게 떨어질 뿐 아니라 수 시간을 대기해야 겨우 결과를 보거나 시스템 자체가 다운되는 경우도 흔했다.

이러한 상황에서 단순 조회 이상의 연관 분석은 최근 수 분 정도의 최근 데이터에 대해 인메모리에서만 가능한 일이었기 때문에, 대규모 데이터를 연관 분석하는 일은 상상하기도 어려웠다.

많은 아키텍트들은 관계형 데이터베이스에 데이터마트를 정의해서 TOP N 통계를 미리 생성하고, 텍스트 로그 자체는 일 단위로 압축하는 설계를 했는데, 이는 주어진 여건에서 최소한의 통계 보고서라도 빠르게 조회하고자 하는 땜질 처방에 불과했다. 미리 정의되지 않은 통계는 조회 자체가 불가능했기 때문에, 가능한 많은 조합의 데이터마트를 정의해야 했고 이는 다시 많은 디스크 공간 소모로 이어졌다. 압축된 텍스트 파일은 전체를 압축 해제해 조회 및 검색해야 했기 때문에 디스크 공간은 덜 사용했지만 사실상 조회 검색이 불가능한 상황을 야기했다.

2010년 대 이후 루씬, 하둡과 같은 오픈소스 빅데이터 기술이 등장하자 많은 사람들이 기존의 성능 문제가 해결되지 않을까 기대했으나, 풀텍스트 고속 검색과 대규모 통계 및 연관 분석을 모두 지원하는 시스템은 존재하지 않는다는 사실을 깨닫게 되었다. 엘라스틱은 조인을 지원하지 않고, 하둡은 실시간 검색을 지원하지 않는다. 이에 엘라스틱과 하둡 양쪽으로 데이터를 저장하는 땜질 처방이 2020년인 지금도 계속되고 있다.

“로그프레소, 자체 기술로 단일 빅데이터 플랫폼 개발…기존 기술들 문제 해결”

로그프레소는 이 문제를 근본적으로 해결하려면 직접 밑바닥부터 빅데이터 플랫폼을 설계해야 한다고 믿었고, 결국 실시간 스트리밍 분석, 실시간 인덱싱과 고속 풀텍스트 검색, 드릴다운을 포함한 실시간 통계 분석, 대규모 분산 통계와 조인, AI 머신러닝까지 완전하게 자체 기술로 구현한 단일 빅데이터 플랫폼을 만들어냈다.

많은 시스템들이 유행에 따라 아키텍처 스타일이 변화하는데, 빅데이터의 성능에 초점을 맞추지 않으면 근본적으로 해결하기 어려운 성능 병목을 맞게 된다. 로그프레소는 I/O를 극단적으로 줄이기 위하여 머신별 단일 프로세스, 인코딩과 압축 효율 극대화, 데이터 파이프라인의 병렬화를 모든 영역에서 구현했다.

빅데이터의 핵심은 로직이 있는 곳으로 데이터를 옮기는게 아니라, 데이터가 있는 곳으로 로직을 옮기는 것이다. 예를 들어 분산 통계나 조인을 수행한다면, 전송해야 하는 데이터량을 최소화하도록 쿼리 플래너가 자동으로 쿼리를 재작성해 데이터 노드로 내려보낸다.

검색 고속화에는 역인덱스(inverted index)와 블룸필터(bloom filter)가 활용된다. 특히 블룸필터는 최소의 용량으로 키워드가 존재하지 않는 블록을 완전히 건너뛸 수 있도록 지원함으로써 장기간 데이터 검색에서 최적의 성능을 도출한다.

통계 분석은 스키마리스 컬럼스토리지 엔진이 실시간 분석을 가능하게 한다. 대규모 분석 쿼리를 실행할 때 필요한 컬럼은 일부분이므로, 기존의 OLTP 시스템이 사용하는 행 단위 레코드 레이아웃을 열 단위로 바꾸게 되면 반드시 필요한 데이터 영역만 읽고 처리할 수 있게 되므로 성능이 수십 배 향상된다. 여기에 벡터 단위의 쿼리 실행은 단일 인스트럭션으로 여러 개의 데이터를 동시에 연산하는 SIMD를 활성화하기 때문에 기존 시스템 대비 100배 이상의 성능을 낼 수 있게 된다. 이는 예전에 불가능하던 자유로운 데이터 통계와 연관 분석을 가능하게 한다.

암호화된 데이터에서 컬럼스토리지는 더욱 빛을 발하는데, 특허 등록된 로그프레소 기술은 분석 쿼리에서 요구하는 컬럼만 복호화를 수행함으로써 암호화 된 데이터에 대해서도 최상의 분석 성능을 도출한다.

로그프레소는 여기에 그치지 않고 쿼리 실행 시점에 비정형 데이터의 타입을 추론해 쿼리를 실행 시간에 컴파일한다. 이는 인터프리터 방식의 쿼리 엔진에서 발생하는 모든 오버헤드를 제거한 머신 코드를 런타임에 생성해 대규모 분석 쿼리 실행의 성능을 최적화한다.

이러한 근본적인 데이터 처리 기술의 발전은 매일 수백 기가에서 테라바이트 단위의 데이터가 유입되는 상황에서도 이전에 불가능하던 검색과 분석을 사용자가 원하는대로 수행할 수 있도록 지원하게 되었다.

양봉열 대표는 “오픈소스 기반의 빅데이터 플랫폼이 여러 컴포넌트의 조합으로 높은 복잡도, 낮은 성능, 많은 장애 포인트, 장기적 데이터 호환성 문제를 가진다”는 점을 지적하며 “완전하게 구현된 단일 빅데이터 플랫폼만이 안정적 보안 운영을 담보한다”고 강조했다.

로그프레소 양봉열 대표의 PASCON 2020 발표자료는 데일리시큐 자료실에서 다운로드 가능하다.

https://www.dailysecu.com/news/articleView.html?idxno=116401

둘러보기

더보기

로그프레소, AI 기반 SOAR 기술 특허 등록

[데이터넷] 로그프레소(대표 양봉열)는 AI 기반 SOAR 기술 특허를 등록했다고 18일 밝혔다. 이 특허는 보안 담당자의 의사결정을 학습하여 AI 모델을 생성하고 이를 기반으로 위협 탐지, 분석, 대응의 전 과정을 완전히 자동화하는 데 목적을 두고 있다. 로그프레소는 본 특허를 SOAR 플랫폼인 ‘로그프레소 마에스트로(Logpresso Maestro)’에 적용할 계획이다. 기업에 도입되는 단위 보안시스템의 유형과 수량이 늘어나고 5G 초연결 시대에 진입하면서 보안 로그와 경보가 급격히 증가하고 있다. 수집, 저장, 분석, 탐지는 AI·빅데이터 기반 플랫폼에서 지원되지만, 위협 탐지 이후의 대응 조치는 수작업으로 진행되기 때문에 보안 담당자의 업무 부담이 과중해지는 문제가 있다. SOAR는 API를 통해 각종 위협 인텔리전스, 네트워크 보안 장비, 엔드포인트 솔루션 등을 연동하여 자동화함으로써 단순 반복적인 업무를 줄여준다. 그러나 IP 차단 등 중요한 의사결정은 장애 발생 가능성 등으로 인해 여전히 수작업으로 남아 있으며 이는 보안 운영 자동화의 효율이 극대화되지 못하는 요인으로 작용한다. 로그프레소의 특허 기술은 플레이북 수행 과정에서 취합된 정보를 기반으로 보안 담당자에게 승인을 요청할 때 플레이북에서 취합된 변수와 의사결정 결과의 쌍을 기록하며, 이를 바탕으로 AI 의사결정 모델을 생성하여 보안 담당자의 개입 없이 플레이북의 모든 과정이 완전히 자동화하므로 분석 및 대응 속도가 극대화된다. 양봉열 로그프레소 대표는 “이번 특허 기술을 통해 보안 운영 초자동화의 새로운 전기를 마련했다”며 “지속적인 기술 개발을 통해 보안 운영 효율을 더욱 극대화하겠다”고 말했다. [http://www.datanet.co.kr/news/articleView.html?idxno=157330](http://www.datanet.co.kr/news/articleView.html?idxno=157330)

2021-03-18

[2020 상반기 인기상품]고객만족-로그프레소/통합로그 관리솔루션/로그프레소 3.0

빅데이터 전문기업 로그프레소의 통합로그 관리솔루션 '로그프레소 3.0'이 전자신문 2020년 상반기 인기상품에 선정됐다. 법과 컴플라이언스를 준수하기 위한 용도로 도입했던 통합로그 솔루션이 이제는 조직 인프라와 애플리케이션(앱)에 대한 가시성 확보를 위해 도입하는 추세로 변화하고 있다. 이런 분위기 속에서 독보적 빅데이터 핵심 기술을 보유한 로그프레소가 주목받고 있다. 코로나19 사태로 인해 최근 기업들은 가상사설망(VPN), 영상회의 서비스, 데스크톱가상화(VDI) 등 비대면 원격 근무를 지원하기 위한 솔루션을 적극 도입하고 있다. 기존 사용하던 온프레미스 솔루션을 클라우드로 전환하는 움직임도 적극 일어나고 있다. 이런 변화에서 조직이 사용하는 기업 내부 인프라와 클라우드 인프라, 앱 등에 대한 통합 모니터링 및 분석이 중요한 이슈로 떠오르고 있다. 로그프레소는 정보기술(IT) 인프라에서 발생하는 다양한 데이터 수집·저장·분석·시각화에 이르는 전체 과정을 단일 엔진으로 처리할 수 있는 실시간 빅데이터 솔루션이다. 각종 컴플라이언스를 만족시키는 것부터 효과적이고 신속한 보안 침해사고 분석, 데이터 위·변조 방지 등 통합로그 관리체계를 지원한다. 로그프레소는 수천만 건의 이벤트를 실시간으로 분석한다. 2013년 첫 버전이 발표된 로그프레소는 금융, 통신, 공공 등 각종 산업 분야에 걸쳐 응용 영역을 넓혀 왔다. 컴플라이언스 준수, 서비스 품질데이터 실시간 분석, 개인정보 유출 탐지, 하루 20테라바이트에 이르는 통신 로그 분석까지 다양한 목적으로 활용됐다. 한 기업과 소비자간 거래(B2C) 마켓플레이스 업체는 로그프레소를 활용해 전국 인터넷데이터센터(IDC)에서 발생하는 로그에 대해 원본 로그 통합 관리, 위·변조 방지 암호화 저장을 수행해 다양한 컴플라이언스 이슈를 해결했다. 관세청은 로그프레소를 도입해 개인정보를 다루는 모든 시스템 업무 로그와 엔드포인트 보안솔루션에서 발생하는 각종 로그를 실시간 수집·분석하는 체계를 마련했다. 로그프레소는 임시 데이터를 남기지 않고 수집과 동시에 실시간으로 데이터를 암호화해 개인정보 관련 로그 데이터를 안전하게 저장한다. 이 솔루션은 SK인포섹, 지니언스, 엑스게이트, RSA 등 국내외 다양한 보안 벤더와 직접 협력했다. 깊이 있는 보안 로그 분석이 가능하다. 구글 클라우드 플랫폼(GCP), 아마존 웹 서비스(AWS), 오피스(Office) 365 등 각종 클라우드 인프라, 서비스 등 로그를 한곳에서 통합 분석할 수 있다. 다른 통합 로그 관리솔루션과 확실한 차별점으로 꼽힌다. 이 솔루션은 올해 2월 정보보안 전문 기업 아이티윈과 조달 총판 계약을 체결했다. 올해는 지난해보다 크게 성장한 조달 쇼핑몰 판매 실적을 거둘 것으로 기대되고 있다. 로그프레소 조달 사업을 총괄하는 구동언 상무이사는 “차별화한 빅데이터 기술 기반으로 언택트 시대에 요구되는 통합로그관리, 빅데이터 플랫폼 수요에 대응하겠다”고 말했다. 박소라기자 srpark@etnews.com [https://www.etnews.com/20200618000262](https://www.etnews.com/20200618000262)

2020-06-23

오픈베이스X로그프레소, 파트너 계약 체결…"빅데이터 기반 플랫폼으로 영역 확장"

오픈베이스(대표 송규헌)가 로그프레소(대표 양봉열)와 기술 파트너(Technology Partner) 계약을 체결했다고 7일 밝혔다. 오픈베이스는 하이브리드 클라우드 전문기업으로 이번 '로그프레소'와의 파트너 협약을 통해 빅데이터 기반 플랫폼으로 비즈니스 영역을 확대할 계획이다. 2013년 설립된 로그프레소는 정형/비정형 데이터를 수집, 저장, 분석 및 시각화 하는 통합 데이터 플랫폼에서부터 보안 데이터 수집, 분석 및 운영 자동화하는 SOAR 플랫폼까지 자체 기술력을 갖추고 있다. 범용 빅데이터 플랫폼, 통합로그분석솔루션, 정보보호 통합플랫폼, 보안운영 자동화 플랫폼 등을 출시하며 빅데이터 원천 기술 연구개발을 바탕으로 한 다수의 특허를 보유하고 있다. 오픈베이스는 관계자는 이번 협약에 대해 "로그프레소와 파트너십을 체결함으로써 빅데이터 플랫폼 기반 영역을 컨설팅 및 구축할 수 있으며, 디지털 트랜스포메이션(Digital Transformation)시대에 고객의 다양한 니즈에 유기적으로 대응할 수 있게 됐다"면서 "앞으로 긴밀한 협업을 통해 빅데이터 기반 정보보호, 이상거래탐지, IoT, 인프라 장애예측 및 스마트 팩토리 분석 플랫폼 등 다양한 플랫폼을 고객에게 확대 제공할 계획"이라고 말했다. 전자신문인터넷 서희원 기자 (shw@etnews.com) [https://www.etnews.com/20210407000230](https://www.etnews.com/20210407000230)

2021-04-07