С появлением концепции больших данных бизнес получил возможности, которые еще недавно считались фантастическими. Обработка информации в режиме реального времени и увеличение точности прогнозов кардинально изменили многие бизнес-процессы. Сотни мировых компаний оценили плюсы обработки данных непосредственно в оперативной памяти. Обработка данных "in-memory" применяется на транспорте, в банках, нефтегазовой отрасли и даже общественных туалетах. Эти технологии ставятся все более привычными и в России — несложно найти датацентр в Москве, который их применяет.
Под термином "Большие данные" подразумевается не только впечатляющий объем информации, но и огромное количество источников, из которых она поступает, а также множество разнообразных форматов их представления. Большие данные без их системного анализа особой выгоды бизнесу не приносят. Настоящее преимущество получают те компании, которые могут анализировать весь объем накопленной информации в реальном времени и с той точки зрения, которой требует сложившаяся конкретная ситуация. Именно такой тип данных и составляет основу для принятия своевременного бизнес-решения.
Одним из главных элементов системы big data является особое хранилище, в которое собирается неструктурированная информация из множества источников — "озеро данных". Некоторые эксперты считают, что организации не всегда нужно создавать и содержать такое "озеро" — в мире уже сложилась схема их аутсорсинга. Хранилище неструктурированных данных может располагаться и в "облаке". Аналитики предрекают исчезновение понятия "большие данные" — они станут обычными данными, гораздо важнее, что они останутся "умными".
Эффективно использовать стекающуюся в "озеро данных" информацию можно, если следовать некоторым простым правилам: