Поиск штрих кода по названию товара

Всем привет. Наверное, уже многие слышали, знакомы, а быть может даже уже столкнулись, с законодательством, которое теперь обязывает указывать полное наименование товара или услуги в реквизитах кассового чека. И вот тут начинает вырисовываться вопрос, а как же быть, если номенклатуры не 100 или даже не 500 наименований, а несколько тысяч?

Время на прочтение

Добрый день. Мы собираем информацию о товарах, и среди этой информации есть штрихкоды. Мне показалось, что именно они имеют ценность в том числе в отрыве от остальных данных, и что их проще всего выложить в открытый доступ. Получилась база на 1 816 200 записей. Товары из нее встречались в продаже на российском рынке в период с начала 2021 до средины ноября 2022 года, это отличает нашу базу от некоторых других, которые есть в свободном доступе.

Содержание
  1. Поиск по штрихкоду (GTIN)
  2. Поиск GTIN
  3. Поиск по номеру предприятия (GLN)
  4. Поиск GLN
  5. Поиск по серийному коду транспортной упаковки (SSCC)
  6. Поиск SSCC
  7. Поиск INN
  8. Company Name
  9. Как по штрих-коду определить подлинность товара
  10. Что такое «подлинность» товара?
  11. Как по штрих-коду определить подлинность товара (на примере сайта GS1)
  12. Как проверить товар на подлинность по штрих-коду через приложение «Честный знак»
  13. Как найти информацию о товаре по штрих-коду онлайн в интернете и через мобильное приложение
  14. Зачем искать товар по штрих-коду в интернете?
  15. Как найти товар по шнрих коду в интернете (расшифровать штрих-код EAN онлайн)?
  16. Резюме
  17. Знакомство с API Barcodes catalog
  18. Где скачать?
  19. Что там?
  20. Что мы делаем с этими данными?
  21. Горькие сожаления
  22. Откуда данные?
  23. Формат представления
  24. Корысть
  25. Зачем это нужно нам?
  26. Условия использования
  27. Особенности
  28. Какие категории представлены?
  29. Косяки
  30. Дефективные коды
  31. Приватные коды
  32. Классификация
  33. Поиск релевантных сервисов
  34. Как помочь?
  35. Зачем он нужен?
  36. База данных штрихкодов скачать бесплатно без регистрации (и прочей хурмы)
  37. Полнота и актуальность
  38. Как вы можете использовать эти данные?
Про мини ПК:  Меркурий 115Ф инструкция по исправлению ошибок

Поиск по штрихкоду (GTIN)

GTIN – идентификационный номер GS1 для единичной или групповой упаковки товара наносится в виде штрихового кода на упаковку товара в виде кода EAN-13 или EAN-8. Является уникальным идентификатором товара.

Поиск GTIN

Trade Item Ownership

Trade Item Info

Поиск по номеру предприятия (GLN)

GLN – идентификационный номер GS1 для идентификации предприятий или мест нахождения (склады, подразделения) в цепях поставок, обеспечивает уникальную идентификацию места нахождения в цепях поставок.

Поиск GLN

Exact address of GLN

Owner of GLN

Поиск по серийному коду транспортной упаковки (SSCC)

SSCC – идентификационный номер GS1 для логистической упаковки товара (предназначенной для транспортировки или хранения). Код SSCC существует только на период существования логистической упаковки и является обязательным элементом Логистической Упаковки.

Поиск SSCC

ИНН – Индивидуальный Номер Налогоплательщика – цифровой код, упорядочивающий учёт налогоплательщиков в Российской Федерации. Присваивается как юридическим, так и физическим лицам.

Поиск INN

Поиск по названию предприятия позволяет найти предприятие по названию и стране регистрации. Если Вы получаете сообщение о большом количестве результатов уточните поля “Адрес (улица)”, “Почтовый индекс”, “Город”.

Company Name

Документы, необходимые для размещения заказа

После обработки заявки мы направляем Вам на электронную почту счет договор. Оплата производится по безналичному расчету или любым удобным для Вас способом согласно выставленному счету на р/с организации.  Пожалуйста правильно указывайте назначение платежа.

Срок разработки и присвоения штриховых кодов до 2-х рабочих дней после даты зачисления платежа на Р/с.

скоренное исполнение заказа возможно, если после оплаты вы направите нам на электронную почту копию платежного документа. После этого заказ передается в работу. На следующий день после оплаты, при подтверждении зачисления средств на наш р/с, Вы получаете на указанный Вами электронный адрес выполненную работу.

Как заполнить список продукции

Поиск штрих кода по названию товара

Номер по порядку.

2. Специфика продукции: название продукции, соответствующее названию на упаковке, артикул, Торговая Марка, ТУ, ГОСТ. Например: сок яблочный 100%; крупа гречневая ядрица высший сорт; кошелек из кожзаменителя на кнопке арт. 123 и т.п. Торговая Марка или наименование производителя: «Солнечная долина», ИП Иванов И.И., ООО «Солнышко».

3. Единичная упаковка, к-во или вес (объем): 100 грамм, пакет полиэтиленовый; 1 шт., пакет полипропиленовый; 1 комплект, коробка картонная; 400 грамм, контейнер пвх; 900 грамм, банка стекдянная; 1,5 л., бутылка ПЭТ и т.п.

5. Транспортная упаковка: заполняется только в том случае, если Вы планируете наносить штриховой код на тару для транспортировки и складского хранения. Указываете количество единичной упаковки, находящейся в транспортной (оптовой) упаковке, например 60 шт., гофрокороб; 10 шт., мешок полиэтиленовый; 1000 шт., ящик деревянный и т.п.

Выбираете формат графического файла, если он Вам нужен.

Документы, предоставляемые Вам после выполнения заказа

1. На адрес электронной почты, указанной в заявке, направляется письмо о регистрации с вложенными документами (счет договор акт):

при заказе Тарифов МК  — письмо о присвоении и регистрации штрих кодов в системе EAN-13, список зарегистрированных штрих кодов с графическим изображением (пожалуйста не используйте это изображение для печати на упаковке, т.к. для этого необходимо заказать мастер файл), мастер файлы (если Вы заказывали их изготовление) отправляются в электронном виде. Регистрацию в базе данных системы EAN-13 Вы можете проверить здесь по штрих коду, ИНН и УНП/GLN.

при заказе Тарифов РКl — письмо о регистрации предприятия в системе, список с Выделенным Интервалом Диапазона штрих кодов ean-13 и itf-14, который в дальнейшем Вы заполняете самостоятельно, назначая новой продукции штрих коды из списка, согласно инструкции по работе со штрих кодами, генератор мастер файлов штриховых кодов вы скачиваете по ссылке в письме или самостоятельно генерируете графический файл у нас на сайте здесь. Регистрацию предприятия в электронной базе данных системы EAN-13 Вы можете проверить здесь по ИНН и УНП/GLN.

2. После получения от нас акта выполненных работ, подпишите его и направьте нам на электронную почту отсканированную копию.

Как по штрих-коду определить подлинность товара

Поиск штрих кода по названию товара

Каждый потребитель заинтересован в приобретении качественного товара. Как минимум, для этого он должен быть подлинным. Что это означает и как  проверить товар по штрих-коду на подлинность — рассмотрим далее.

Что такое «подлинность» товара?

Под «подлинностью» товара следует понимать установленный факт его выпуска тем производителем, который владеет правами на соответствующий товар (торговую марку, модель, тип). Если товар выпущен не тем производителем, то он — не подлинный, то есть контрафактный.

Примечательно, что «подлинный» не всегда означает качественный. Иногда может наблюдаться ситуация, когда контрафакт по своим потребительским свойствам лучше оригинала. Но это скорее исключение. Покупатель, приобретая фирменные кроссовки, будет ожидать, что они выпущены оригинальным производителем.

Установить подлинность товара (и, соответственно, определить, что он с высокой вероятностью контрафактный при неосуществлении установления его подлинности) российский гражданин может:

Штрих-кодов на упаковке может быть много. Общераспространено использование кода в формате EAN, который имеет длину 13 цифр, в которых зашифрованы:

  • код страны-производителя (России принадлежит интервал 460-469);
  • код предприятия, которое произвело товар;
  • код товарной позиции.

После расшифровки кода потребитель, таким образом, сможет узнать, кто выпустил товар (и иные полезные сведения о нем).

Минусы рассматриваемого способа:

  • штрих-код EAN поставщик контрафакта может легко скопировать с оригинальной коробки (и воспроизвести на своей нелегальной);
  • штрих-код привязывается к товарной позиции (определенному наименованию товара), а не к конкретному изделию.

Вполне может получиться так, что с теми же кодами будут поставляться и контрафактная и легальная партии кроссовок.

Таким образом, проверка штрих-кода — это способ, позволяющий очень условно удостовериться в том, что товар — не контрафакт. Наиболее эффективен он в случаях, когда товар относится к новейшим (только что поступил в продажу, вступил в моду), и у поставщиков контрафакта не могло быть достаточного количества времени, чтобы «перехватить» легальные коды для последующего копирования на свои упаковки в необходимом количестве.

Марка — идентификатор (как правило, представляющий собой двумерный QR-код — более сложный (и емкий) в сравнении с обычным одномерным штрих-кодом), который позволяет проследить движение товара (причем, конкретного изделия, а не товарной позиции) от производителя (импортера) на прилавок. Поставщик контрафакта может на каком-либо из участков такого движения скопировать марки — но у него не получится «активировать» их (то есть, разрешить к отпуску в розницу) через систему маркировки без доступа к электронной подписи легального участника товарооборота.

Таким образом, марка практически гарантированно позволит удостоверить подлинность товара. Если она нелегально скопирована и наклеена на контрафактную упаковку, то потребитель легко узнает об этом — получив в установленном порядке от системы маркировки сообщение, что изделие не прошло процедуру выпуска в продажу.

Тем не менее, для наиболее достоверной проверки изделия на подлинность имеет смысл задействовать оба способа — и проверку товара по штрих-коду EAN, и проверку по марке. Ознакомимся с примерами общедоступных инструментов для решения данной задачи.

Как по штрих-коду определить подлинность товара (на примере сайта GS1)

Проверить подлинность товара по штрих-коду можно, обратившись к той или иной публичной базе данных штрих-кодов по товарным позициям. Одна из них доступна на сайте российского представительства компании GS1 – которая выдает производителям из РФ штрих-коды в формате EAN. Речь пойдет, таким образом, о проверке кодов, начинающихся на 460-469.

Заинтересованному лицу — например, покупателю, для удостоверения подлинности товара от российского производителя по штрих-коду нужно:

1. Зайти на сайт представительства GS1 в России (ССЫЛКА).

2. Выбрать раздел «Сервисы», затем — «Поиск по штрих-коду (GTIN)».

Поиск штрих кода по названию товара

3. Ввести штрих-код (начинающийся на 460-469) и выбрать тип данных, которые должны быть показаны по данному коду:

• о производителе;

• о товаре.

Поиск штрих кода по названию товара

Например, если ввести штрих-код 4600338006130 (с упаковки с яблочным пюре «Фруто-Няня») и выбрать, чтобы отражались данные о производителе, то на экране отобразятся:

  • наименование, адрес производителя, его GLN (номер в системе GS1, привязанный к географическому расположению хозяйствующего субъекта);
  • контактные данные (ФИО ответственного специалиста, его телефон, e-mail).

Поиск штрих кода по названию товара

А если выбрать, чтобы отражались данные о товаре, то покупатель сможет ознакомиться:

  • с официальным названием товара (в котором может быть конкретизировано его назначение, в рассматриваемом случае «для питания детей раннего возраста»);
  • с наименованием торговой марки;
  • с количеством продукта в банке (90 граммов);
  • с наименованием производителя.

Поиск штрих кода по названию товара

Также можно загрузить изображение банки с пюре.

Поиск штрих кода по названию товара

Система может выдать ответ Prefix no longer subscripted, и это может означать, что товар выведен из оборота. И если на его упаковке такой код, то есть вероятность, что продукт контрафактный (или сбываются его очень старые партии).

Как проверить товар на подлинность по штрих-коду через приложение «Честный знак»

В России маркировка товаров — новое явление (как, к слову, и в большинстве других стран). Пока что обязательно марки ставятся на меховых изделиях, лекарствах, с недавних пор — на табачной продукции и обуви.

Чтобы проверить товар на предмет подлинности по марке, нужно воспользоваться приложением «Честный знак» (ССЫЛКА).

Пользоваться им очень просто. Нужно установить его на смартфон, запустить, а затем — используя камеру мобильного гаджета, отсканировать QR-код на товарной упаковке.

Поиск штрих кода по названию товара

Система прочитает его, сверит с базой данной по системе маркировки и выдаст сообщение — о том, является ли товар подлинным или нет.

Поиск штрих кода по названию товара

При обнаружении контрафактного товара пользователь средствами приложения сможет уведомить контролирующие органы об этом.

Поиск штрих кода по названию товара

График включения различных типов товаров в систему маркировки приведен ЗДЕСЬ. За технологическое сопровождение системы маркировки отражает специализированная организация — ЦРПТ. Читать новости об этой системе и знакомиться с различными разъяснениями по ней можно на сайте данной организации — ССЫЛКА.

Как найти информацию о товаре по штрих-коду онлайн в интернете и через мобильное приложение

Поиск штрих кода по названию товара

Практически на любой товарной упаковке или коробке, что выставляется на прилавке российского магазина, имеется штрих-код (иногда — даже несколько кодов). С помощью данного идентификатора заинтересованное лицо может узнать много полезных сведений о покупаемом товаре. Рассмотрим далее где и как можно выполнить поиск товара по штрих-коду онлайн — какие сведения можно получить и в чем их полезность.

Зачем искать товар по штрих-коду в интернете?

Прежде чем отвечать на данный вопрос, нужно определиться, о каком штрих-коде идет речь. Дело в том, что на товаре (упаковке) могут быть размещены:

Это тот самый узнаваемый всеми штрих-код, который, как правило, начинается с 3-х цифр, показывающих страну происхождения товара (например, России принадлежит интервал кодов 460-469). Кроме страны происхождения, в коде EAN/UPS – на примере европейского кода EAN с 13 цифрами (вообще есть много разновидностей рассматриваемого штрих-кода — европейские, американские, внутрироссийские), «шифруются»:

  • с помощью следующих 6 цифр — регистрационный номер предприятия, которое изготовило товар;
  • с помощью следующих 3 цифр — порядковый номер товара на производстве;
  • контрольное число с помощью 13 цифры.

Поиск штрих кода по названию товара

Не редкость — наличие на российском рынке товаров кодов, которые начинаются не с идентификатора страны-производителя, а с цифры 1. Это значит, что производитель применил вместо международного кода страны EAN (или в дополнение к нему) как раз внутрироссийский идентификатор для внутреннего рынка (который, таким образом, не может быть задействован при экспорте товаров). Но использование именно международного кода EAN, так или иначе, следует считать общераспространенным в России. Как правило, привычный одномерный штрих-код на товарах сформирован именно с помощью стандарта EAN с указанием кода страны происхождения товара.

Заказать товарный код EAN производитель товара может, обратившись в региональное представительство международной организации EAN. Можно отметить, что компетенциями в предоставлении такого кода обладает организация GS1 – у которое тоже есть российское представительство — ССЫЛКА. Многие производители обращаются именно туда — так как у GS1 есть налаженные юридические и технологические механизмы обеспечения заявителей необходимыми штрих-кодами.

Основная цель применения штрих-кода EAN — учет движения товара от предприятия на прилавок (в котором могут участвовать самые разные хозяйствующие субъекты), а также с прилавка конечному потребителю. Код выступает идентификатором отдельно взятого типа продукта — двух одинаковых кодов по разным товарам быть не может.

Практическая полезность EAN-кода для конечного потребителя — в том, что он может, осуществив расшифровку кода, сверить данные о производителе, что указаны текстом на упаковке, и содержимое кода — что также включает эти данные.

Кроме того, можно удостоверить, собственно, подлинность самого кода: не исключено, что недобросовестный поставщик нанес его наугад (или не зарегистрировав в установленном порядке в управомоченной организации).

Узкое место подобной проверки: нет гарантии, что правильный код — составленный на оригинальный товар, не будет целенаправленно нанесен поставщиком-нарушителем на контрафактную упаковку. Все штрих-коды — так или иначе, общедоступны, и просто скопировать их — с тем, чтобы «переклеить» на любые реализуемые нелегально упаковки, поставщик контрафакта может очень легко.

Сопоставление кода и данных о производителе товара может помочь владельцу бизнеса выйти на данного производителя напрямую. Цели предпринимателя могут быть разные — организация закупок, совместное производство, иные инициативы. Контакты на самой упаковке не всегда бывают информативны, а по штрих-коду можно найти полезные сведения (далее мы рассмотрим, каким образом).

Отметим, что вместо кода EAN могут быть применены различные альтернативные идентификаторы — поскольку обязательное применение данного стандарта не закреплено российским законодательством. Но, как мы уже отметили выше, производители предпочитают все же использовать код, о котором идет речь.

Обязательной маркировке подлежат реализуемые в России шубы, фармпрепараты, а с недавних пор — обувь и табачная продукция. Скоро к ним добавятся другие востребованные типы продовольственных и непродовольственных товаров (а к 2024 году, как ожидается — все типы товаров).

Задача применения марки — не просто учет, а отслеживание движения товара от конкретного производителя к конкретной торговой точке. Если товар промаркирован в полном соответствии с законом и должным образом учтен в системе маркировки, то на точке отпуска он будет иметь статус подлинного — то есть, не контрафактного.

Теоретически марку, как и обычный штрих-код, можно скопировать на контрафактную упаковку. Однако, соответствующую упаковку конечный поставщик не сможет выпустить в оборот — поскольку до того товар с данной маркой будет отражен в системе маркировки как выведенный в оборот легальным поставщиком. От его имени недобросовестному поставщику действовать сложно: нужен будет доступ к его квалифицированной электронной подписи.

Также отметим, что марка идентифицирует отдельно взятый товар (в то время как код EAN – только наименование товарной позиции). Безусловно, по содержанию марки, как правило, также можно узнать то, кто произвел товар, как и основные его свойства — в этом в части информативности она близка штрих-коду, рассмотренному выше.

Если штрих-код представлен маркой, то его «расшифровку» можно осуществить с помощью мобильного приложения «Честный Знак». С помощью удобных интерфейсов пользователь сможет определить, является ли купленный им товар подлинным — в случае, если он подлежит маркировке.

В данном коде могут быть зашифрованы основные идентификаторы товара (наименование, артикул, цена) — в целях ведения внутреннего учета товара в чистом виде. К рассмотренным выше кодам он не имеет отношения. Если магазин небольшой, то внутренние учетные коды могут и вовсе не применяться (в этом случае идентификатором товара как раз будет его код EAN в случае его использования).

Так или иначе, под «штрих-кодом» в самом общем случае все-таки понимается именно код EAN. Марки еще только начинаются внедряться в России (а в мире — далеко не общераспространенны). Внутреннего учетного кода на товаре вообще может не быть (а если он есть, то для рядового потребителя — бесполезен).

Как мы уже отметили выше, для потребителя расшифровка кода EAN – средство дополнительного удостоверения данных о производителе. Такая расшифровка может быть произведена с помощью разных онлайновых инструментов — ознакомимся с ними подробнее.

Как найти товар по шнрих коду в интернете (расшифровать штрих-код EAN онлайн)?

Для поиска товара по штрих-коду онлайн и расшифровки общераспространенного штрих-кода EAN можно использовать:

Примеры популярных ресурсов, на которых они размещены:

barcode-list.ru — ССЫЛКА  (в базе данных более 500 000 товарных позиций)

Поиск штрих кода по названию товара

barcodesdatabase.org  — ССЫЛКА

Поиск штрих кода по названию товара

gepir.gs1ru.org — ССЫЛКА

Поиск штрих кода по названию товара

Что касается товаров, произведенных в России, то третий по списку ресурс — администрируемый российским представительством компании GS1, можно назвать одним из самых информативных в части представления данных, которые зашифрованы в штрих-коде.

Поиск штрих кода по названию товара

Поиск штрих кода по названию товара

Так, по коду товара, который начинается на 460-469, на сайте GS1 можно установить, к примеру:

  • официальное наименование товара;
  • то, как звучит торговая марка;
  • количество товара (например, если это продукт — его вес в граммах) внутри упаковки;
  • наименование производителя.

Также возможна расшифровка штрих-кода конкретно на предмет ознакомления со сведениями о производителе.

Отметим, что по многим товарам в базе данных GT1 присутствуют их фотографии — с которыми можно ознакомиться на странице расшифровки кода (и сверить с реальным изображением продукта — вдруг будут очевидные различия, что даст повод говорить о проблемах с подтверждением подлинности товара).

В их числе — программы:

«Честный знак» — ССЫЛКА

Поиск штрих кода по названию товара

Поиск штрих кода по названию товара

Поиск штрих кода по названию товара

Поиск штрих кода по названию товара

Поиск штрих кода по названию товара

«Штрих код сканер» (ССЫЛКА)

Поиск штрих кода по названию товара

QR сканер штрих-кода (ССЫЛКА).

Поиск штрих кода по названию товара

В мобильных приложениях может быть предусмотрен разный функционал в части работы с кодам. В одних решениях дело ограничивается предоставлением базовых сведений о товаре и его производителей, в других — данные дополняются ценами, отзывами о товаре.

Лучше всего задействовать сразу несколько инструментов: бывает, что в одной базе данных (на сайте или в мобильном приложении) нет сведений по определенному коду, а в другой — есть (а по другому коду — наоборот).

Резюме

Почти каждая товарная упаковка содержит одномерный штрих-код типа EAN, в котором зашифрованы данные о стране происхождения товара, его производителе и основных потребительских характеристиках. Расшифровать код можно на специальных сайтах — подключенных к базам данных товарных позиций или через мобильные приложения. Основная цель такой расшифровки — дополнительное подтверждение данных, написанных на упаковке (с точки зрения отражения данных о товаре и производителе). Другая возможная цель — определение прямых контактов производителя.

Знакомство с API Barcodes catalog

Описание всех доступных методов можно найти тут

Для получения коллекции наименований используйте следующий хост. Обратите внимание, что используется ограничение на количество запросов в секунду.

Ответ выглядит следующим образом и возвращаются уже в отсортированном виде

Для увеличения рейтинга наименования можно использовать инкрементный метод, передав в теле запроса id наименования.

Пожалуй, на этом можно заканчивать. Всем большое спасибо за внимание и успехов в поиске.

Где скачать?

В обоих случаях структура записи следующая:

  • Id — идентификатор, уникальный в рамках таблицы.
  • Category — категория товарав том же виде, что и в источнике, где найден штрих-код. Мы старались брать наиболее конкретную категорию в иерархии.
  • Vendor — бренд товара.
  • Name — название товара.
  • Article — артикул производителя товара.
  • Barcode — штрихкод.

Что там?

Там таблица, содержащая записи штрихкодов и соответствующие им наименования товаров, во всех записях есть категория и во многих — бренд.

Спектр представленных товаров очень широкий. Тяжелой техники там нет, но потребительские сегменты присутствуют, вероятно, все (фармацевтика, парфюмерия, косметика, продукты питания, игрушки, sexshop-ассортимент, книги, канцелярия, метизы, инструменты и т.д. и т.п.)

Оригинальная он-лайновая версия справочника хранится на сервере Universe-HTT.
Открытая версия размещена на github’е. Обратите внимание на то, что в исходниках хранится фрагментированная база данных. Полный файл находится в релизе.

Что мы делаем с этими данными?

По большому счету, именно штрихкоды для нас не играют большой роли. Они есть на примерно два процента товаров в базе, и поэтому мы не можем использовать их как основной фактор для сопоставления товаров, только как вспомогательный, при этом не особо важный.

Раскрою тему. У нас есть большая база товаров. У клиента есть каталог его товаров (либо каталоги его поставщиков). Мы сопоставляем свои товары товарам из каталога клиента, и это позволяет автоматически найти изображения для товаров и заполнить характеристики. Об этом я уже написал несколько статей с довольно подробным описанием используемых подходов и алгоритмов: про сопоставление товаров, про автоматическое создание карточек, про поиск похожих товаров, про быстрый поиск по неточному соответствию среди ста миллионов записей.

Соответственно, штрихкоды участвуют в двух процессах:

  • Их совпадение является фактором, который позволяет (после некоторых дополнительных проверок) рассматривать товары из разных источников как один и тот же товар.
  • Мы можем заполнить штрихкод автоматически, если в каталоге клиента для какого-то товара его нет, а у нас в базе — есть.

Кстати, не стоит использовать два процесса одновременно, получается положительная обратная связь, и тогда ошибки получают дополнительное подтверждение.

В общем, мы делаем PIM-систему, и у нее есть некоторые возможности по автоматизации ручного труда.

Горькие сожаления

Не желая выдавать нужду за добродетель, сообщу, что мы рассчитывали каким-то образом монетизировать обсуждаемый справочник. Однако, заметных успехов на этой ниве за прошедшие годы нам достичь не удалось. Посему решили: пусть лучше будет общий, чем пропадет нахрен. Как-то так выглядят наши мотивы для означенного действа.

Спасибо за внимание.

Откуда данные?

Мы собрали их своими силами за два года. Мы парсим довольно много сайтов, больше трехсот, но медленно, на самые популярные приходится 2-3 запроса в минуту, на менее популярные — несколько запросов в час. С посещенных страниц мы забираем название товара, его цену, описание, характеристики и ссылки на изображения. Если по разметке страницы можно выделить категорию, бренд, артикул в отдельные поля — выделяем, если нет — оставляем название как есть. В итоге у нас получилась база, где есть 70 миллионов товаров, 160 миллионов изображений и миллиард с небольшим характеристик.

Среди характеристик иногда встречаются штрихкоды. Именно их я собрал в отдельный файл и выложил в открытый доступ.

Стоит оговориться, что это сырые данные, и среди них могут встречаться ошибки. Например, не все из штрихкодов пройдут валидацию по какому-либо из стандартов: EAN-13, EAN-8, UPC-A или UPC-E. Кроме того, некоторые штрихкоды встречаются больше одного раза. Это тоже объяснимо: значит, они встречались на нескольких разных сайтах, и, скорее всего, ссылаются на один и тот же товар. Но не обязательно: некоторые компании сами придумывают штрихкоды для своей продукции по принципу “подойдут любые 13 цифр”.

Формат представления

База данных представлена текстовым файлом в кодировке UTF-8 с полями, разделенными символом табуляции.

  • ID: Внутренний идентификатор товара
  • UPCEAN: Штрихкод
  • Name: Наименование товара
  • CategoryID: Внутренний идентификатор категории
  • CategoryName: Наименование категории. Так как справочник категорий иерархический, то это наименование составное — от самого верхнего уровня до терминального уровня, которому принадлежит товар. Разделители уровней — слэш (‘/’)
  • BrandID: Внутренний идентификатор бренда
  • BrandName: Наименование бренда

Внутренние идентификаторы едва ли кому интересны — мы их выгружаем только для собственных целей (если вдруг понадобится точно идентифицировать ссылку на запись при возникновении каких либо вопросов со стороны).

Записи в свободно распространяемом формате отсортированы по наименованию товара в алфавитном порядке.

Корысть

Если вам понравился справочник, то отметьте его на github’е звездочкой. Если он вам очень понравился — отметьте звездочкой еще и проект OpenPapyrus, ибо все администрирование и управление справочником осуществляется с его помощью.

Зачем это нужно нам?

Возможно, у кого-то, кто потом найдет эту статью через поисковик, будет стоять более широкая задача из области работы с товарами. Возможно, мы сможем ему помочь.

Условия использования

Нет никаких. Как хотите, так и используйте. Если дадите ссылку на нас — спасибо, нет — переживем.

Особенности

Если вы внимательно изучите представленные данные, то заметите, что в отличии от большинства, имеющихся в интернете аналогичных справочников (и платных и бесплатных), над наименованиями товаров была проведена интенсивная работа.

Пара слов о том, как мы это делаем.

Прежде всего, справочник (администрируемый в системе OpenPapyrus) подвергается автоматическому процессингу с помощью технологии, которую я как-то описывал на Хабре.

Хотел бы сказать, что упомянутая технология все за нас делает. Но, увы. Большой объем работы приходится делать в полу-автоматическом и ручном режимах.

Многие наименования приходится «дешифровывать» — в первоисточнике они могут содержать немыслимые сокращения и полностью пренебрегают нашей системой именования товаров 🙂

Все штрихкоды, опубликованные в открытом доступе, гарантированно прошли проверку на соответствие одному из 4-х стандартов: EAN-13, EAN-8, UPC-A, UPC-E и включают контрольную цифру. Возможные дефекты и проблемы опишу ниже.

Какие категории представлены?

Потребительские товары, кроме одежды, обуви, продуктов и лекарств. Некоторые товары промышленного назначения.

Косяки

Справочник содержит ряд дефектов. Их не много, но сообщить о них необходимо.

Дефективные коды

Далее, есть путаница в товарах. То есть, в некоторых (крайне редких случаях) штрихкоду соответствует наименование, совсем к нему не относящееся.

Приватные коды

Некоторые штрихкоды могут быть приватными. Те EAN-13, которые начинаются на 2 мы отбрасываем на старте, но иногда что-то идет не так и попадаются приватные коды, либо начинающиеся на ‘2’, либо те, что начинаются с какой-то иной цифры, являясь тем не менее частными, не зарегистрированными ни в какой из организаций, занимающихся этим (GS1, например).

Классификация

Как мы не старались наладить хорошую классификацию справочника — удалось не много. Треть позиций принадлежит группе default — то есть абсолютно не классифицирована. Остальные вполне могут иметь ошибочную принадлежность категориям.

Далеко не все товары ассоциированы с брендами, хотя мы и очень трудились над этим вопросом.

Поиск релевантных сервисов

После длительного поиска более-менее подходящих вариантов было найдено несколько:

  • Barcodelookup — стартовый пакет включает в себя 5000 запросов по цене 99$. Весьма, не дешево.
  • Olegon — 0.10 копеек за 1 запрос: цена привлекательная, но база грязная. Так же есть и бесплатная версия с лимитом на количество запросов в секунду, а именно 3 запроса в секунду.
  • Barcodes-catalog — 0.5 копеек за 1 запрос. Среди претендентов, представленных выше, цена тут наиболее привлекательная и результаты поиска приятно удивили. Так же есть и бесплатная версия с лимитом на количество запросов в секунду, а именно 3 запроса в секунду.
  • Бесплатный дамп базы, который ребята разместили здесь же, на Хабре — Большинство искомых данных отсутствовали, но все равно ребятам + за старанияПо результатам тестирования баз Olegon и Barcodes-catalog было решено использовать базу Barcodes-catalog, как основную, так как результаты поиска все же больше понравились тут, а на случай отсутствия какого либо из наименования в Barcodes-catalog, как дополнительное место поиска, использовать Olegon.

Как помочь?

Если у вас есть желание помочь в расширении справочника, то мы будем благодарны за присланные данные об известных вам штрихкодах. Я сильно сомневаюсь, что найдутся желающие, но на всякий случай сообщаю, что по информации в профиле найти меня не сложно.

Тот, кто имеет возможность реализовать автоматическую классификацию элементов справочника и поделится идеями и наработками, получит титул невероятно любезного человека. Мы же со своей стороны обязуемся информировать общественность об успехах собственных изысканий в этой области.

Зачем он нужен?

Те, кто искал (чаще всего безуспешно) в интернете или где-либо еще справочник штрихкодов и так знает зачем он нужен. Для остальных перечислю полезные свойства такого обширного массива данных:

  • Прежде всего, это список товаров с «твердыми» идентификаторами. То есть, вы берете произвольный товар, например, лежащий у вас на тумбочке, и по штрихкоду, напечатанному на упаковке, можете сопоставить его с аналогичным товаром, находящимся где-нибудь на складе в Рио-Де-Жанейро.
  • Следствием из предыдущего пункта будет возможность облегчить электронный документооборот между предприятиями, ибо проблема синхронизации большей части (но не всех, конечно) товаров отпадает.
  • Вы можете быстро открыть новый магазин, не вбивая поступившие товары в учетную систему, а получая их из такого справочника поиском штрихкода (сильно идеализированный пример, ну да ладно).

Приведенные варианты и их возможные вариации довольно банальны. Есть и куда более интересные применения этого справочника:

  • Анализ словаря товарных наименований
  • Обучение нейронных сетей для классификации товаров и нормализации их наименований
  • Разработка «интеллектуальных» систем для сравнения ценовых предложений из разных источников
  • Сравнительный анализ продаж и иных операций на не связанных предприятиях

База данных штрихкодов скачать бесплатно без регистрации (и прочей хурмы)

Добрый день. В открытом доступе наконец-то появился огромный справочник штрихкодов с наименованиями товаров, категориями и брендами.

Мы работаем над ним лет 8 и теперь в нем около 3 миллионов штрихкодов в стандартах EAN (EAN-13, EAN-8) и UPC (UPC-A, UPC-E).

Полнота и актуальность

На типичный вопрос «все ли штрихкоды есть в справочнике?» ответ стереотипен: нет и быть не может.

Если оценивать полноту справочника по вероятности отсутствия там штрихкода, который случайно попался вам на глаза, то это будет процентов 10-15 (очень грубая моя собственная оценка, к тому же, сами понимает, предвзятая). В любом случае, ничего похожего по размеру в открытом доступе больше нет

Географический охват (по странам, в которых товары продаются) значителен: Россия, Украина, Беларусь, США, Великобритания, Европейский Союз, ЮАР, Бразилия, Малайзия и многие иные.

Языки представления главным образом русский и английский. Источники с остальными языками мы обычно игнорируем, поскольку ничего в тех языках не смыслим (в виде исключения встречаются позиции на испанском, чешском, и прочих языках).

Мы обновляем справочник на сервере Universe-HTT с периодичностью в несколько месяцев (когда накапливаем в предварительном буфере достаточный объем данных). Последний раз заливали данные в июне этого года. Совсем новые позиции там скорее всего отсутствуют. Однако, хотя это и покажется удивительным, новые штрихкоды появляются не так уж часто. Многие товары с одними и теми же кодами продаются в ритейле годами.

Открытую версию справочника так же планируем время от времени обновлять.

Как вы можете использовать эти данные?

Как угодно. Никаких ограничений или условий нет. Мы просто делимся справочником с теми, кому он нужен. Кому нет, тот ничего не теряет.

Оцените статью
Карман PC
Добавить комментарий