• 스텔스 시작 AtScale은 Hadoop 데이터에 최고의 BI 툴을 제공합니다.

AtScale의 Design Center 소프트웨어는 유능한 Tableau 사용자가 Hadoop의 원시 파일 위에 측정 값과 치수를 칠하는 것을 허용하기위한 것입니다.

1 년 간의 베타 프로젝트가 시작된 후 시작 AtScale은 스텔스 모드에서 Hadoop의 비즈니스 사용자 인터페이스로 설명하는 제품을 출시했습니다.

하둡 초기에 야후에서 근무한 스태프가 설립 한 캘리포니아 산 마테오 (San Mateo)에 위치한이 회사는 하둡 (Hadoop)에있는 기존 비즈니스 인텔리전스 툴과 데이터 사이에 위치하도록 설계된 애플리케이션 인 인텔리전스 플랫폼 (Intelligence Platform)을 발표했다.

AtScale의 설립자이자 CEO 인 David Mariani는 사용자가 일반적으로 선택을하고 Tableau 및 Microsoft Excel과 같은 도구에 만족한다고 말하면서 회사는 시각화 계층에 주력하기를 거부했습니다.

AtScale CEO David Mariani : 최종 사용자는 Hadoop의 데이터를 직접 말할 수 있습니다.

“기업은 이미 너무 많은 비즈니스 인텔리전스 툴을 보유하고 있으며, 무엇보다 비즈니스를 수행하는 사람들에게 100 개의 BI 툴을 제공하기 때문에 다른 기업을 추가하지는 않을 것입니다. “그는 말했다.

“그러나 우리는 이러한 도구를 사용할 수 있도록 할 것이며 데이터 관 리자와 IT 부서가 너무 복잡하고 유지 보수 및 확장이 어려우며 기존의 데이터 인프라를 Hadoop으로 대체 할 수 있도록 할 것입니다.”

AtScale에 따르면이 애플리케이션은 Hadoop을 다차원 OLAP 큐브로 비즈니스 사용자에게 표시합니다.이 큐브에서는 데이터가 차원, 계수 및 계층 구조로 분류되어 쿼리 속도를 높입니다.

“최종 사용자는 독점 큐브에 맞서는 것처럼 보이고 작동합니다. 실제로 AtScale을 통해 Hadoop의 데이터와 직결됩니다.”라고 Mariani가 말했습니다.

구독 기반 소프트웨어는 클러스터 자체가 아닌 Hadoop 클러스터의 클라이언트 또는 게이트웨이 노드에 설치되며 큐브를 관리하기 위해 별도의 클러스터, 데이터 집합 또는 서버 세트가 필요하지 않습니다.

회사의 접근법 중 일부는 기업에 부과되는 비용과 복잡성 때문에 클라이언트 소프트웨어와 드라이버를 만드는 것을 피하는 것이 었습니다.

“여기서 핵심은 Impala, Spark 및 Spark SQL, Tez의 Hive, Presto 및 Drill과 같은 다양한 SQL-on-Hadoop 엔진을 포함하여 Hadoop 에코 시스템을 매우 활용한다는 것입니다.”라고 Mariani는 말했습니다.

일반 기업이 데이터 아키텍처와 관련하여 자원이 풍부한 웹 거물을 에뮬레이션 할 가능성은 거의 없을 것 같습니다. 네오 테크놀로지 (Neo Technology)의 CEO 에밀 이프 렘 (Emil Eifrem)은 이러한 가능성은 생각보다 가깝다고 말합니다.

우리는 사용자가 시각화 도구를 사용하여 상호 작용하는 큐브 인터페이스 (동적 인 큐브 (실제 엔티티가 아닌))를 제공합니다. 우리의 소프트웨어가하는 것은 SQL-on-Hadoop 엔진을 통해 Hadoop과 대화하고 인터페이스에서 실제로 OLAP 큐브와 같은 성능을 제공합니다.이 성능은 사용자가 기대하는 측정 값, 차원 및 계층 구조 및 드릴 다운 및 크로스 탭입니다. .

“큐브는 완전히 동적입니다 .Hadoop에 정의 된 메타 데이터입니다. 일단 데이터가 HDFS에 저장되면 고급 플랫폼에서 쿼리하고 실행할 수 있습니다. 따라서 데이터 이동 아키텍처가 아니기 때문에 사용자가 실제로 가지고있는 것과는 다릅니다 시장에서보고. ”

이 아키텍처 덕분에 추출 또는로드 프로세스가 없습니다. 변환은 쿼리시에 인라인으로 수행됩니다.

Couchbase는 Hortonworks Hadoop과 단일 분석 및 트랜잭션 데이터 저장소를 연계 함 Databricks CEO : Apache Spark에 비해 많은 기업이 진출한 이유 MySQL : Percona가 대규모 데이터 세트를위한 TokuDB 스토리지 엔진을 연결하고 Cloudera가 Hadoop 개발자 Cask, Mesosphere 및 MapR 링크 Teradata, 대형 데이터 애플리케이션 출시, Loom 업데이트, MapR CEO, Hadoop, 2015 IPO 가능성 말하기, Teradata, 기록 애플리케이션 제작 업체 RainStor 인수, Hortonworks, 인증 프로그램 확대, 기업 가속화 기대 Hadoop 도입 : Actian은 SPARQL City의 그래프 분석 엔진을 병기에 추가하고 Splice Machine의 Hadoop 데이터베이스는 일반 릴리스로 전환

“스키마 온로드 (schema-on-load) 아키텍처와는 대조적으로 진정한 스키마 온칩 (schema-on-read)입니다. 큐브 정의 자체는 변환을 포함합니다. 모두 메타 데이터로 중앙 집중화되고 클러스터에 호스팅되므로 이러한 정렬이라고 생각할 수 있습니다 시맨틱 비즈니스 레이어를 Hadoop에 추가하여 사용자가 비즈니스 시각화 툴과 상호 작용할 때 질의시 변환을 주입 할 수 있습니다 “라고 Mariani는 말했습니다.

큐브 자체는 위에서 본 AtScale의 디자인 센터에 구축되어 있습니다.이 디자인 센터는 유능한 Tableau 사용자가 Hadoop의 원시 파일 위에 측정 값과 치수를 칠할 수 있도록 설계되었습니다.

“하이브 (Hive) 메타 스토어를 통한 기술은 파일의 정의가 무엇인지 이해하기 때문에 숙련 된 비즈니스 사용자가 측정 값, 치수를 계산하고 계층 구조뿐만 아니라 계산을 정의한 다음 가져옵니다. BI 툴에 발표했다 “고 말했다.

최근 오픈 데이터 플랫폼과 피보 탈 (Pivotal)의 발표는 하둡 시장에서 변화가 일어나고 있음을 보여주는 신호라고 Hortonworks 사장 인 허브 큐 니츠 (Harb Cunitz)는 전했다.

Big Data Analytics, 빅 데이터 애널리틱스, DataRobot은 데이터 과학의 저조한 성과를 자동화하는 것을 목표로하고 있으며 Big Data Analytics, MapR 창업자 인 John Schroeder는 사임하고, 대체 할 COO

“Excel을 통해 연결하는 경우 [Microsoft SQL Server] Analysis Services 큐브처럼 보이며 MPX [Microsoft Project Exchange]처럼 보입니다. 예를 들어 Tableau를 통해 연결하는 경우 Hive 서버처럼 보입니다 Tableau에서 SQL을 사용하면 SQL을 말할 수 있으므로 SQL을 사용하거나 MPX를 AtScale에 말할 수 있으므로 Hadoop에 대한 쿼리로 직접 번역 할 것입니다. ”

2 년 동안의 스텔스 모드 기간 동안 AtScale은 Altiscale, Cloudera, Databricks, Hortonworks 및 MapR뿐만 아니라 Microsoft, QlikTech 및 Tableau와의 비즈니스 인텔리전스 측면에서 많은 파트너십을 구축했습니다.

AtScale은 실시간 데이터 집계를 사용하여 1 초 또는 그 이하의 Hadoop 쿼리 시간을 제공하는 것을 목표로합니다.

“우리는 실제로 쿼리 패턴을 검사하고 재구성 할 때 대 클러스터에 라이브 데이터에 액세스 할 때 똑똑한 집계를 실제로 계산하고 유지 관리하고 있습니다. 이러한 집계와 SQL-on-Hadoop 엔진을 조합하여 임팔라 (Impala)와 스파크 SQL (Spark SQL)은 일관된 1 초 이하의 쿼리 성능을 제공 할 수 있습니다.

하둡 및 빅 데이터에 대한 추가 정보

“왜 재결합하고, 왜 변화가 없는지 다시 생각해야하는 이유는 무엇입니까? 왜 이미 한 번 파일을 만들었습니까? 수십억 또는 수조 줄을 한 번 파일에 전달하는 이유는 무엇입니까? 우리가 수행하는 작업은 실제 집계와 실제 데이터를 혼합하는 것입니다. 하둡 (Hadoop) 클러스터에 부하를 걸지 않고있을 필요가 없을 때 반복적으로 작업을 수행합니다. ”

LinkedIn, 새로운 블로깅 ​​플랫폼 발표

Big OLAP 시대인가?

DataRobot은 데이터 과학의 낮은 매달린 열매를 자동화하는 것을 목표로합니다.

MapR 창업자 존 슈뢰더 (John Schroeder)가 물러났다.