Значение данных

(Ди Джорджио Този)
16/02/22

Общеизвестно, что в Интернете очень много данных разных типов и источников. Данные, которые обычно доступны для просмотра через те браузеры, которые позволяют нам взаимодействовать с сетью способами, которые могут быть только текстовыми (например, чтение статьи) или даже мультимедийными (аудио, видео и потоковая передача).

Таким образом, кажется, что все эти данные доступны каждому и могут быть использованы для извлечения информации, которая может помочь нам направлять наши повседневные жизненные решения.

На самом деле все не так прозрачно и просто. Методы использования этих данных фактически рассчитаны на интерактивность, которая отличает отношения человека и машины. Трудности возникают, когда вы хотите повторно использовать эти данные для их обработки в личных целях для извлечения информации, представляющей особый интерес для отдельного пользователя.

Чтобы уточнить, мы ссылаемся на случай цен на акции любого рынка (Borsa Italiana, Nyse или Nasdaq ...): существует множество сайтов, которые позволяют анализировать производительность акции (TICKER) и предоставляют в целом ряд связанных данных: стоимость, количество обработанных товаров, дневные максимумы и минимумы и так далее. Интерфейс для этих данных, как уже говорилось, типичен для взаимодействия человека и машины: браузер.

Если бы я хотел обрабатывать эти данные локально для извлечения интересующей меня информации, все значительно усложнялось бы. Для доступа к тем же данным из программного интерфейса доступны 2 метода: соскоб или доступ через определенный интерфейс данных, такой как API REST (передача репрезентативного состояния) или SOAP (простой протокол доступа к объектам), где REST на сегодняшний день является наиболее распространенным и используемым решением.

Давайте кратко проанализируем две альтернативы. То соскоб основан на имитации поведения человека путем передачи интересующей веб-страницы клиенту и последующего вмешательства в поиск интересующих данных путем идентификации описания известное признание. Например, используя определенные теги HTML, которые позволяют идентифицировать данные, представляющие интерес для целей HTML-страницы.

Хотя доступны библиотеки на различных языках программирования (JavaScript, Python, Java, ...), которые так или иначе облегчают идентификацию и распознавание конкретных данных, процедура не является немедленной и подвержена ошибкам. Более того, если исходная HTML-страница изменится, возможно, скрипт разработан неправильно, потому что описания распознавание (например, изменился тег, идентифицирующий данные), поэтому это решение, хотя и возможное, может быть проблематичным из-за сложности реализации и жесткой зависимости от структуры HTML-страницы.

Решение на основе программного интерфейса API REST (или SOAP) абсолютно надежнее и проще в реализации.

Задача этих интерфейсов — стандартизировать методы доступа к данным. Поэтому в случае интерфейсов REST будет использоваться технология HTTP, а запрошенные данные будут считываться с помощью GET по конкретным URL-адресам, построенным таким образом, чтобы однозначно идентифицировать интересующие данные.

В качестве примера я сообщаю URL-адрес для доступа к REST-интерфейсу службы конвертации валюты, предоставляемой Банком Италии.

https://tassidicambio.bancaditalia.it/terzevalute-wf-web/rest/v1.0/dailyRates?referenceDate= {даты} & baseCurrencyIsoCode = {из} ¤cyIsoCode = {ОТТ} & lang = {"это"}

Термины, выделенные жирным шрифтом, используются для определения задействованных валют и даты оценки коэффициента конвертации. Операция GET для этого URL-адреса вернет искомое значение. Эту операцию можно легко реализовать из любого языка программирования (Python, Javascript, C#,…) с помощью соответствующих библиотек.

Хотя существует множество бесплатных сервисов, основанных на этом типе интерфейса, интересно отметить, что есть много сайтов, которые предлагают финансовую информацию за плату. Обычно это особенно подробные данные, которые предлагают полный обзор аспектов, связанных с финансовой информацией, касающейся рынков и компаний по всему миру. Я хотел бы подчеркнуть, что многие из этих сайтов, особенно те, которые связаны с экономическими и финансовыми аспектами, предлагают полный доступ только по той или иной форме подписки.

В основном использование данных через программный интерфейс является платным. Это помогает укрепить базовую концепцию, которую часто упускают из виду: в Интернете реальная ценность заключается в данных. Если агрегированные и пригодные для использования, но все же общедоступные данные листинговых компаний имеют определенную ценность и являются предметом предложений о подписке, мы можем представить, какую ценность имеют наши личные данные, которые мы более или менее сознательно предоставили множеству компаний. что они управляют сайтами электронной коммерции или социальными сетями.

Ссылки

Один из многих сайтов, предлагающих финансовую информацию по подписке. https://site.financialmodelingprep.com/developer/docs/pricing

Углубление в интерфейсе REST https://www.ibm.com/cloud/learn/rest-apis