빅데이터 분석 예제

배운 교훈: 데이터 사일로와 품질은 곰입니다. Bechtel은 대용량 데이터를 분석할 수 있지만 비즈니스 전반에 걸쳐 있는 데이터의 품질을 개선해야 합니다. “우리는 스스로를 혼란에 빠뜨리고 데이터 사일로를 어떻게 작동하고 브리지하는지 살펴보았습니다.” 빅 데이터 속도는 비즈니스 프로세스, 애플리케이션 로그, 네트워크 및 소셜 미디어 사이트, 센서, 모바일 장치 등과 같은 소스에서 데이터가 유입되는 속도를 다룹니다. 데이터의 흐름은 방대하고 연속적입니다. 볼륨은 실제로 저장되고 생성된 데이터의 크기를 의미합니다. 데이터 집합이 빅 데이터인지 아닌지 판단된 데이터의 크기에 따라 다릅니다. 데이터는 마케팅 및 제품 개발에서 점점 더 중요한 역할을 합니다. 소비자는 전화, 이메일 또는 소셜 네트워크로 의견을 공유하는 데 큰 역할을 하며, 이를 통해 자신의 목소리를 듣고 접근 방식을 조정할 수 있습니다. 우리는 종종 우리가 두 개의 귀와 한 입을 가지고 이유에 대해 이야기 – 그것은 우리가 말하는 것보다 더 듣고 하는 것이 좋습니다.

이는 소비자 입력에 대한 당사의 접근 방식에서도 마찬가지입니다. 또한 데이터는 다양한 시청자에게 보다 관련성이 있는 콘텐츠를 만드는 데 도움이 됩니다. 다양한 오더에게 다르게 말하는 광고 콘텐츠를 만드는 데 집중하고자 합니다. 어떤 사람들은 음악을 좋아합니다. 다른 사람들은 일년 중 어떤 시간에 상관없이 모든 스포츠를 시청합니다. 당사의 브랜드는 이미 이러한 공간에서 볼 수 있으며, 데이터를 사용하여 사람들의 열정에 부합하는 브랜디드 콘텐츠를 제공하기 위해 노력하고 있습니다. 빅 데이터 기술은 데이터 웨어하우스로 이동해야 하는 데이터를 식별하기 전에 새 데이터에 대한 준비 영역 또는 방문 영역을 만드는 데 사용할 수 있습니다. 또한 빅 데이터 기술과 데이터 웨어하우스를 통합하면 조직이 자주 액세스하지 않는 데이터를 오프로드할 수 있습니다. 빅 데이터는 테라바이트 에서 엑사바이트까지 고려할 수 있는 크고 복잡한 데이터 집합을 위해 제공됩니다. 이 거대하고 복잡한 데이터 세트는 RDBMS와 같은 일반적인 기존 데이터 관리 응용 프로그램에서 조작할 수 없습니다.

여기서 빅 데이터는 이러한 대규모 데이터 집합을 관리하는 데 사용되었습니다. 빅 데이터는 요구 사항과 요구 사항에 따라 비구조화, 구조화 및 반구조화 된 데이터 세트에 적용 할 수 있습니다. 빅 데이터는 주로 구조화되지 않은 데이터 집합에 초점을 맞추고 있는 반면, 요즘 빅 데이터 분석은 미디어, 교육, 의료, 제조, 다양한 정부 및 비정부 부문과 같은 다양한 분야에 적용되었으며 복잡한 분석, 실시간 사기 관리, 교통 관리, 고객 중심의 분석 등을 제공합니다. 이러한 도구 중 하나인 Databricks는 아파치 스파크를 통해 스트리밍 데이터를 캡처합니다. Shell은 이 도구를 사용하여 기계 부품을 구매할 시기, 보관 기간 및 재고 품목을 배치할 위치를 더 잘 계획합니다. 빅 데이터는 일반적으로 RDBMS에서 처리하는 일반적인 알고 있는 데이터 집합보다 훨씬 크고 복잡한 데이터 집합을 의미합니다.