Skip to content

Библиотека адаптеров для упрощенной работы с алгоритмами, контейнерами и файлами

License

Notifications You must be signed in to change notification settings

Erofivan/Adapters-Library

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Adapters-library

Описание

Библиотека адаптеров для упрощенной работы с алгоритмами, контейнерами и файлами. Обобщенный подход к алгоримам и итераторам позволяет более элегантно решать типовые задачи.

Например, для решения задачи нахождения частотности слов среди всех текстовых файлов директории, код может выглядеть следующим образом:

Dir(argv[1], recursive) 
    | Filter([](std::filesystem::path& p){ return p.extension() == ".txt"; })
    | OpenFiles()
    | Split("\n ,.;")
    | Transform(
        [](std::string& token) { 
            std::transform(token.begin(), token.end(), token.begin(), [](char c){return std::tolower(c);});
            return token;
        })
    | AggregateByKey(
        0uz, 
        [](const std::string&, size_t& count) { ++count;},
        [](const std::string& token) { return token;}
      )
    | Transform([](const std::pair<std::string, size_t>& stat) { return std::format("{} - {}", stat.first, stat.second);})
    | Out(std::cout);

Еще одним значимым отличием такого подхода от классических является то, что вычисления являются могут быть ленивыми, а создаваемые объекты не владеют массивом данных для решения данной задачи. Подобный подход, в частности, применяется в классах std::string_view и std::span

Реализованные адаптеры

  • Dir - берет все файлы в директории (и рекурсивно по всем поддиректориям)
  • OpenFiles - открывает файловый поток для каждого пути из предыдущего адаптера
  • Split - делит входной поток по списку делимитеров передаваемых через аргументы
  • Out - выводит данные в выходной поток
  • AsDataFlow - преобразует контейнер в поток данных для дальнейшей обработки
  • Transform - изменяет значения элементов, наподобие того как это делает алгоритм transform, применяя заданную функцию к каждому элементу
  • Filter - фильтрация по определенному признаку, признак передается в качестве аргумента
  • Write - проходится по всем элементам входного диапазона и записать их в указанный поток вывода, вставляя между элементами (а также после каждого элемента) заданный разделитель.
  • AsVector - собирает результаты обработки в вектор
  • Join - объединяет два потока данных по ключу, аналогично операции LEFT JOIN в SQL
  • KV - структура ключ-значение, используемая для операций объединения
  • JoinResult - результат операции объединения, содержащий данные из обоих потоков
  • DropNullopt - фильтрует std::optinal<T> поток от std::nullopt значений
  • SplitExpected - в случае если предыдущий адаптер возвращает expeceted, позволяет разделить пайплайн обработки на 2 для ожидаемых и нет результатов
  • AggregateByKey - агрегация значений относительно соответствующего ключа. Значение, соответствующее ключу, обновляется через переданный функциональный объект - агрегатор. Выполняется не лениво
    • Пример:
      aggregator := 
      [int value{}](char c) { 
          value++; 
          return value; 
      }
      [ a, b, c, d, a, a, b, d ] -> [ (a, 3), (b, 2), (c,1), (d,2) ]

Требование по памяти ко всем адаптерам кроме AggregateByKey и Join - константа.

Тестирование

Все вышеуказанные сущности были покрыты тестами, с помощью фреймворка Google Test.

NB

При реализации классов, для их использования в range-based for,был реализован ряд требований.

About

Библиотека адаптеров для упрощенной работы с алгоритмами, контейнерами и файлами

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published