Парсинг новостной ленты «Яндекс Дзен. Новости»

12 марта, 18:43 «Фрилансим»

Требуется реализовать алгоритм, который осуществляет извлечение информации из веб-ресурса "Яндекс Дзен. Новости", используя для этого язык программирования Python 3.12 в сочетании с фреймворками Requests 2.31.0 и Beautiful Soup 4.12.3.
Входные данные включают информацию о регионе, представленную в виде названия города на кириллице, а также список идентификаторов новостных статей, уже опубликованных в чате с пользователем. Необходимо выполнить проверку, чтобы идентификатор полученной статьи не находился в списке уже отправленных статей. В случае, если не обнаружено новых новостей, а получены только те, которые ранее уже были опубликованы, алгоритм не должен возвращать никаких данных.

Учитывая, что URL-адрес веб-ресурса "Яндекс Дзен" принимает значение региона на латинском языке (например, "Москва" преобразуется в "Moscow"), необходимо заранее адаптировать входные данные в соответствии с этим требованием.

Для каждой полученной новости должен быть создан словарь, включающий следующие параметры: "title" (заголовок статьи), "description" (описание статьи), "date" (время публикации), "attachments" (в случае наличия нескольких вложений, они представляются в виде списка), "link" (ссылка на ресурс) и "id" (идентификатор новостной статьи, который будет записан в базу данных для проверки, не была ли данная новость уже получена пользователем за сегодняшний день). Поиск новостей ограничивается текущим днем.

Яндекс в новостях

«Яндекс Go» рассказал о трудовых буднях таксистов

Кейс «Москвича» и «Яндекс Маркета»: как получить лид в 3 раза дешевле планируемого

Яндекс Погода выяснила, как за последние 30 лет изменились майские заморозки

В Доме Единства состоится джазовый концерт, посвященный Бенни Гудмену

Состоялся релиз стратегии Warbits+ в App Store и Google Play

Ресторатор Аркадий Новиков и местные партнеры инвестируют 100 млн рублей в ресторан в центре Воронежа

Bild: Raiffeisen Bank International купит долю Дерипаски в венской фирме Strabag

Состоялся релиз стратегии Warbits+ в App Store и Google Play

О чём не любит говорить Григорий Лепс

Павел Прилучный решил обжаловать решение суда о взыскании алиментов

Лавиолетт: Шестёркин сыграл чертовски хорошо с «Каролиной»

Чемпионат рекордов: в Подмосковье завершился OLIMPBET предолимпийский чемпионат России по вольной борьбе

Политика: Эксперты: Инаугурация Путина показала верность традициям, истории и ценностям России

Решетников — на выход, а Шойгу и Лавров — задержитесь. Кого мы не увидим в новом составе Правительства России?

Пламя Победы: в 1961 году в Минске зажгли первый в Беларуси Вечный огонь

Рубль упал к основным валютам на закрытии позиций перед длительными выходными

Заслуженный артист России Владимир Семенов отмечает 75-летний юбилей

Что лечит невролог и с какими симптомами к нему обращаться?

Новости тенниса

Рыбакина поделилась ожиданиями от турнира в Риме, на котором ей предстоит защищать титул

Поздравления с Днем Победы

Захарова: Запад хочет вымарать РФ из числа победителей во Второй мировой войне

Погода в Твери сегодня: сильный ветер праздник не испортит

Певец Сергей АРУТЮНОВ и солистка группы Демо - встречаются, или просто выпустили совместный хит “Солнышко”? Разлад АРУТЮНОВА и Маши Малиновской?

Уголовное дело возбудили после смертельного ДТП с грузовиком в Подмосковье

«Берегите себя». Найдены письма с фронта ВОВ 22-летнего красноармейца

МИД рекомендовал россиянам учитывать риски при планировании поездок в Мексику

Победительницу "Диктанта Победы" из Томской области наградили в Москве

7 мая - День борьбы с бронхиальной астмой

Мы помним, мы гордимся: «585*ЗОЛОТОЙ» представила проект «Книга памяти» с историями из семейных архивов сотрудников

Как сохранить здоровье легких?

Концертный Директор для Артистов из Регионов.

Паула Бадос и Стефанос Циципас расстались | Виды спорта

Рыбакина поделилась ожиданиями от турнира в Риме, на котором ей предстоит защищать титул

Двенадцать казахстанских теннисистов поднялись в рейтинге ATP

Энди Роддик: «У меня было несколько типов рака кожи с тех пор, как я завершил карьеру»

83% студентов Института iSpring получили гранты на обучение

Цветёт сон-трава

Клыки Босжиры

"Русские должны извиниться!": Таджики в гневе из-за запрета "тусить" в России

Вдова Шатунова призвала поклонников прекратить мракобесие на могиле певца

Концерт ко Дню Победы проведут в Культурном центре «Интеграция» на Лазо

Певец Сергей АРУТЮНОВ и солистка группы Демо - встречаются, или просто выпустили совместный хит “Солнышко”? Разлад АРУТЮНОВА и Маши Малиновской?

Анна Данилова дала старт Всероссийской акции "Синий платочек Победы" 2024 на станции метро Курская

На Можайском шоссе массовые ДТП из-за непогоды заблокировали движение

Уголовное дело возбудили после смертельного ДТП с грузовиком в Подмосковье

МИД рекомендовал россиянам учитывать риски при планировании поездок в Мексику

Игорь Маковский: оперативный Штаб «Россети Центр» осуществляет усиленный контроль за работой электросетевого комплекса