Попробовать

Особенности загрузки таблиц

📂 В этой статье описаны особенности загрузки файлов таблиц в Smart Data Hub.

Советуем также почитать:
Интеграция с Яндекс.Диск
Интеграция с Google Диск
Интеграция с другими коннекторами

1. Данные из таблицы выгружаются только с первого листа файла. Если будет несколько листов, то они не будут загружены в Smart Data Hub, загрузится только первый. При загрузке файла сервис не проверяет количество листов в файле:

2. В таблице не должно быть пропусков в строках: в каждой ячейке должно быть значение. Иначе данные не будут загружены в систему. В противном случае, после загрузки происходит замена пустых ячеек: для параметров – «none»; для метрик – «0». При этом строки содержащие параметры не выгрузятся, а содержащие показатели – выгрузят нули.

3. В таблице не должно быть пропусков в столбцах.
Например, если данные идут до 4 столбца (см. рис. ниже), затем пропуск (пустой столбец), затем еще «100500» столбцов данных, то скрипт, с некоторыми ограничениями загрузит первые 4 столбца включительно. Система воспринимает такое прерывание как конец таблицы.

Загрузка прерывается на столбце без данных и оставшиеся данные не попадают в хранилище
В классическом сценарии загрузка прерывается за границей таблицы на первом пустом столбце

4. Название таблицы не должно быть слишком длинным (максимум 95 знаков). После загрузки часть имени файла будет отсечена, обработчик файла генерирует уникальный буквенно-цифровой код, который будет дописан к имени файла будет после загрузки.

Для поиска файла – смотрите раздел «Загруженные файлы»:

5. Название таблицы при получении не должно содержать специальные символы.
Это такие символы как слешы «/» «|» «\»; плюсы «+»; запятые «,»; лишние точки «.» и многие другие. В названии файла перед расширением допустимо короткое, среднее или длинное тире «, , » либо нижнее подчеркивание «_». В противном случае сервис выведет ошибку: «В названии файла присутствуют недопустимые символы. Пожалуйста, измените название файла и загрузите файл повторно».

6. Smart Data Hub поддерживает загрузку файлов таблиц в форматах: .xlsx, .xls, .csv, .tsv.
Однако после обработки в базе данных отправляется файл именно в формате .tsv. При загрузке других форматов система выдает ошибку: «Недопустимый формат файла. Используйте следующие форматы: xlsx, xls, csv, tsv».

7. Значения метрик должны быть без пробелов.
Например, при работе в Excel, когда формат ячейки выбран как «Числовой», то по умолчанию система автоматически выделит разряды числа пробелами, а доли запятыми:

Smart Data Hub в качестве разделителя доли поддерживает точку «.», а вот запятая «,» – не поддерживается, система по-разному считывает данные и соответственно вариант «1 000 000,00» — некорректный, верная запись «1000000.00».

8. Обязательно наличие полей «Дата» или «Date». Сервис выполняет сортировку по этому столбцу. В таблице должен присутствовать минимум один такой столбец, но не более одного. Если столбцов с датами больше одного (например «Дата (план)», «Дата (факт)», «Дата создания», «Дата завершения» и т.п.) — Smart Data Hub выведет ошибку.

В отчеты выгружается дата в формате ГГГГ-ММ-ДД (2021-11-01) – другой формат даты не используется. При этом, при загрузке таблиц формат даты ДД.ММ.ГГ (01.11.2021), Д.ММ.ГГГГ (1.11.2021), ГГГГ-ММ-ДД (2021-11-01) автоматически переводится в формат ГГГГ-ММ-ДД (2021-11-01), но, разумеется, не сами значения дат.

При загрузке столбца с датами Smart Data Hub понимает формат ячеек Общий, Числовой, Текстовый и Дата.

9. Особенности загрузки файла с включенным селектором «Разбить данные по датам».

10. Код полей чувствителен к регистру.
Код с заглавной буквой и код с маленькой – это разные коды, соответственно будут созданы разные кастомные поля и записи будут в разных полях.

11. Обязательно проверьте таблицу на наличие «Скрытых» столбцов/строк – в них могут быть вышеобозначенные и другие ошибки.

12. При загрузке таблиц формата .xlsx столбцы с датой должны иметь формат ячеек «Дата». Тогда система автоматически загрузит даты в нужном формате (ГГГГ-ММ-ДД). Если же ячейки с датами в другом формате, то такие даты могут считываться сервисом неверно.

13. Система плохо отрабатывает значения типа «0,09», т.е. два знака после запятой. Скорее всего, при просмотре значения в системе, вы увидите «0». Чем больше нулей после запятой — тем выше вероятность в конечном итоге увидеть «0» в системе (проблема округления). При этом загруженное значение «1,09» отобразится как «1».

14. Модуль загрузки файлов корректно поддерживает только плоские таблицы, таблицы другой комбинаторики, например мультипараметрические и т.д. – поддерживаются в тестовом режиме. Есть риск неправильной обработки таких таблиц.