MoviePilot/app/chain/subscribe.py

import re
from typing import Dict, List, Optional, Union

from app.chain import ChainBase
from app.chain.download import DownloadChain
from app.chain.search import SearchChain
from app.core.metainfo import MetaInfo
from app.core.context import TorrentInfo, Context, MediaInfo
from app.core.config import settings
from app.db.models.subscribe import Subscribe
from app.db.subscribe_oper import SubscribeOper
from app.helper.sites import SitesHelper
from app.log import logger
from app.schemas import NotExistMediaInfo
from app.utils.string import StringUtils
from app.schemas.types import MediaType


class SubscribeChain(ChainBase):
    """
    订阅管理处理链
    """

    # 站点最新种子缓存 {站点域名: 种子上下文}
    _torrents_cache: Dict[str, List[Context]] = {}

    def __init__(self):
        super().__init__()
        self.downloadchain = DownloadChain()
        self.searchchain = SearchChain()
        self.subscribehelper = SubscribeOper()
        self.siteshelper = SitesHelper()

    def add(self, title: str, year: str,
            mtype: MediaType = None,
            tmdbid: int = None,
            season: int = None,
            userid: str = None,
            username: str = None,
            exist_ok: bool = False,
            **kwargs) -> Optional[int]:
        """
        识别媒体信息并添加订阅
        """
        logger.info(f'开始添加订阅，标题：{title} ...')
        # 识别前预处理
        result: Optional[tuple] = self.prepare_recognize(title=title)
        if result:
            title, _ = result
        # 识别元数据
        metainfo = MetaInfo(title)
        if year:
            metainfo.year = year
        if mtype:
            metainfo.type = mtype
        if season:
            metainfo.type = MediaType.TV
            metainfo.begin_season = season
        # 识别媒体信息
        mediainfo: MediaInfo = self.recognize_media(meta=metainfo, mtype=mtype, tmdbid=tmdbid)
        if not mediainfo:
            logger.warn(f'未识别到媒体信息，标题：{title}，tmdbid：{tmdbid}')
            return False
        # 更新媒体图片
        self.obtain_images(mediainfo=mediainfo)
        # 总集数
        if mediainfo.type == MediaType.TV:
            if not season:
                season = 1
            # 总集数
            if not kwargs.get('total_episode'):
                if not mediainfo.seasons:
                    # 补充媒体信息
                    mediainfo: MediaInfo = self.recognize_media(mtype=mediainfo.type,
                                                                tmdbid=mediainfo.tmdb_id)
                    if not mediainfo:
                        logger.error(f"媒体信息识别失败！")
                        return False
                    if not mediainfo.seasons:
                        logger.error(f"媒体信息中没有季集信息，标题：{title}，tmdbid：{tmdbid}")
                        return False
                total_episode = len(mediainfo.seasons.get(season) or [])
                if not total_episode:
                    logger.error(f'未获取到总集数，标题：{title}，tmdbid：{tmdbid}')
                    return False
                kwargs.update({
                    'total_episode': total_episode
                })
            # 缺失集
            if not kwargs.get('lack_episode'):
                kwargs.update({
                    'lack_episode': kwargs.get('total_episode')
                })
        # 添加订阅
        sid, err_msg = self.subscribehelper.add(mediainfo, season=season, **kwargs)
        if not sid:
            logger.error(f'{mediainfo.title_year} {err_msg}')
            if not exist_ok:
                # 发回原用户
                self.post_message(title=f"{mediainfo.title_year}{metainfo.season} "
                                        f"添加订阅失败！",
                                  text=f"{err_msg}",
                                  image=mediainfo.get_message_image(),
                                  userid=userid)
        else:
            logger.info(f'{mediainfo.title_year}{metainfo.season} 添加订阅成功')
            # 广而告之
            self.post_message(title=f"{mediainfo.title_year}{metainfo.season} 已添加订阅",
                              text=f"评分：{mediainfo.vote_average}，来自用户：{username or userid}",
                              image=mediainfo.get_message_image())
        # 返回结果
        return sid

    def remote_refresh(self, userid: Union[str, int] = None):
        """
        远程刷新订阅，发送消息
        """
        self.post_message(title=f"开始刷新订阅 ...", userid=userid)
        self.refresh()
        self.post_message(title=f"订阅刷新完成！", userid=userid)

    def remote_search(self, arg_str: str, userid: Union[str, int] = None):
        """
        远程搜索订阅，发送消息
        """
        if arg_str and not str(arg_str).isdigit():
            self.post_message(title="请输入正确的命令格式：/subscribe_search [id]，"
                                    "[id]为订阅编号，不输入订阅编号时搜索所有订阅", userid=userid)
            return
        if arg_str:
            sid = int(arg_str)
            subscribe = self.subscribehelper.get(sid)
            if not subscribe:
                self.post_message(title=f"订阅编号 {sid} 不存在！", userid=userid)
                return
            self.post_message(title=f"开始搜索 {subscribe.name} ...", userid=userid)
            # 搜索订阅
            self.search(sid=int(arg_str))
            self.post_message(title=f"{subscribe.name} 搜索完成！", userid=userid)
        else:
            self.post_message(title=f"开始搜索所有订阅 ...", userid=userid)
            self.search(state='R')
            self.post_message(title=f"订阅搜索完成！", userid=userid)

    def search(self, sid: int = None, state: str = 'N'):
        """
        订阅搜索
        :param sid: 订阅ID，有值时只处理该订阅
        :param state: 订阅状态 N:未搜索 R:已搜索
        :return: 更新订阅状态为R或删除订阅
        """
        if sid:
            subscribes = [self.subscribehelper.get(sid)]
        else:
            subscribes = self.subscribehelper.list(state)
        # 遍历订阅
        for subscribe in subscribes:
            logger.info(f'开始搜索订阅，标题：{subscribe.name} ...')
            # 如果状态为N则更新为R
            if subscribe.state == 'N':
                self.subscribehelper.update(subscribe.id, {'state': 'R'})
            # 生成元数据
            meta = MetaInfo(subscribe.name)
            meta.year = subscribe.year
            meta.begin_season = subscribe.season or None
            meta.type = MediaType.MOVIE if subscribe.type == MediaType.MOVIE.value else MediaType.TV
            # 识别媒体信息
            mediainfo: MediaInfo = self.recognize_media(meta=meta, mtype=meta.type, tmdbid=subscribe.tmdbid)
            if not mediainfo:
                logger.warn(f'未识别到媒体信息，标题：{subscribe.name}，tmdbid：{subscribe.tmdbid}')
                continue
            # 查询缺失的媒体信息
            exist_flag, no_exists = self.downloadchain.get_no_exists_info(meta=meta, mediainfo=mediainfo)
            if exist_flag:
                logger.info(f'{mediainfo.title_year} 媒体库中已存在，完成订阅')
                self.subscribehelper.delete(subscribe.id)
                # 发送通知
                self.post_message(title=f'{mediainfo.title_year}{meta.season} 已完成订阅',
                                  image=mediainfo.get_message_image())
                continue
            # 使用订阅的总集数和开始集数替换no_exists
            no_exists = self.__get_subscribe_no_exits(
                no_exists=no_exists,
                tmdb_id=mediainfo.tmdb_id,
                begin_season=meta.begin_season,
                total_episode=subscribe.total_episode,
                start_episode=subscribe.start_episode,

            )
            # 搜索
            contexts = self.searchchain.process(mediainfo=mediainfo,
                                                keyword=subscribe.keyword,
                                                no_exists=no_exists)
            if not contexts:
                logger.warn(f'订阅 {subscribe.keyword or subscribe.name} 未搜索到资源')
                continue
            # 过滤
            matched_contexts = []
            for context in contexts:
                torrent_info = context.torrent_info
                # 包含
                if subscribe.include:
                    if not re.search(r"%s" % subscribe.include,
                                     f"{torrent_info.title} {torrent_info.description}", re.I):
                        continue
                # 排除
                if subscribe.exclude:
                    if re.search(r"%s" % subscribe.exclude,
                                 f"{torrent_info.title} {torrent_info.description}", re.I):
                        continue
                matched_contexts.append(context)
            if not matched_contexts:
                logger.warn(f'订阅 {subscribe.name} 没有符合过滤条件的资源')
                # 未搜索到资源，但本地缺失可能有变化，更新订阅剩余集数
                self.__upate_lack_episodes(lefts=no_exists, subscribe=subscribe, mediainfo=mediainfo)
                continue
            # 自动下载
            downloads, lefts = self.downloadchain.batch_download(contexts=matched_contexts,
                                                                 no_exists=no_exists)
            if downloads and not lefts:
                # 全部下载完成
                logger.info(f'{mediainfo.title_year} 下载完成，完成订阅')
                self.subscribehelper.delete(subscribe.id)
                # 发送通知
                self.post_message(title=f'{mediainfo.title_year}{meta.season} 已完成订阅',
                                  image=mediainfo.get_message_image())
            else:
                # 未完成下载
                logger.info(f'{mediainfo.title_year} 未下载未完整，继续订阅 ...')
                # 更新订阅剩余集数
                self.__upate_lack_episodes(lefts=lefts, subscribe=subscribe, mediainfo=mediainfo)

    def refresh(self):
        """
        刷新站点最新资源
        """
        # 所有站点索引
        indexers = self.siteshelper.get_indexers()
        # 遍历站点缓存资源
        for indexer in indexers:
            # 未开启的站点不搜索
            if settings.INDEXER_SITES \
                    and not any([s in indexer.get("domain") for s in settings.INDEXER_SITES.split(',')]):
                continue
            logger.info(f'开始刷新站点资源，站点：{indexer.get("name")} ...')
            domain = StringUtils.get_url_domain(indexer.get("domain"))
            torrents: List[TorrentInfo] = self.refresh_torrents(site=indexer)
            if torrents:
                self._torrents_cache[domain] = []
                # 过滤种子
                result: List[TorrentInfo] = self.filter_torrents(torrent_list=torrents)
                if result is not None:
                    torrents = result
                if not torrents:
                    logger.warn(f'{indexer.get("name")} 没有符合过滤条件的资源')
                    continue
                for torrent in torrents:
                    logger.info(f'处理资源：{torrent.title} ...')
                    # 识别前预处理
                    result: Optional[tuple] = self.prepare_recognize(title=torrent.title,
                                                                     subtitle=torrent.description)
                    if result:
                        title, subtitle = result
                    else:
                        title, subtitle = torrent.title, torrent.description
                    # 识别
                    meta = MetaInfo(title=title, subtitle=subtitle)
                    # 识别媒体信息
                    mediainfo: MediaInfo = self.recognize_media(meta=meta)
                    if not mediainfo:
                        logger.warn(f'未识别到媒体信息，标题：{torrent.title}')
                        continue
                    # 上下文
                    context = Context(meta=meta, mediainfo=mediainfo, torrentinfo=torrent)
                    self._torrents_cache[domain].append(context)
        # 从缓存中匹配订阅
        self.match()

    def match(self):
        """
        从缓存中匹配订阅，并自动下载
        """
        # 所有订阅
        subscribes = self.subscribehelper.list('R')
        # 遍历订阅
        for subscribe in subscribes:
            logger.info(f'开始匹配订阅，标题：{subscribe.name} ...')
            # 生成元数据
            meta = MetaInfo(subscribe.name)
            meta.year = subscribe.year
            meta.begin_season = subscribe.season or None
            meta.type = MediaType.MOVIE if subscribe.type == MediaType.MOVIE.value else MediaType.TV
            # 识别媒体信息
            mediainfo: MediaInfo = self.recognize_media(meta=meta, mtype=meta.type, tmdbid=subscribe.tmdbid)
            if not mediainfo:
                logger.warn(f'未识别到媒体信息，标题：{subscribe.name}，tmdbid：{subscribe.tmdbid}')
                continue
            # 查询缺失的媒体信息
            exist_flag, no_exists = self.downloadchain.get_no_exists_info(meta=meta, mediainfo=mediainfo)
            if exist_flag:
                logger.info(f'{mediainfo.title_year} 媒体库中已存在，完成订阅')
                self.subscribehelper.delete(subscribe.id)
                # 发送通知
                self.post_message(title=f'{mediainfo.title_year}{meta.season} 已完成订阅',
                                  image=mediainfo.get_message_image())
                continue
            # 使用订阅的总集数和开始集数替换no_exists
            no_exists = self.__get_subscribe_no_exits(
                no_exists=no_exists,
                tmdb_id=mediainfo.tmdb_id,
                begin_season=meta.begin_season,
                total_episode=subscribe.total_episode,
                start_episode=subscribe.start_episode,

            )
            # 遍历缓存种子
            _match_context = []
            for domain, contexts in self._torrents_cache.items():
                for context in contexts:
                    # 检查是否匹配
                    torrent_meta = context.meta_info
                    torrent_mediainfo = context.media_info
                    torrent_info = context.torrent_info
                    # 包含
                    if subscribe.include:
                        if not re.search(r"%s" % subscribe.include,
                                         f"{torrent_info.title} {torrent_info.description}", re.I):
                            continue
                    # 排除
                    if subscribe.exclude:
                        if re.search(r"%s" % subscribe.exclude,
                                     f"{torrent_info.title} {torrent_info.description}", re.I):
                            continue
                    # 比对TMDB
                    if torrent_mediainfo.tmdb_id == mediainfo.tmdb_id \
                            and torrent_mediainfo.type == mediainfo.type:
                        if meta.begin_season and meta.begin_season != torrent_meta.begin_season:
                            continue
                        # 匹配成功
                        logger.info(f'{mediainfo.title_year} 匹配成功：{torrent_info.title}')
                        _match_context.append(context)
            logger.info(f'{mediainfo.title_year} 匹配完成，共匹配到{len(_match_context)}个资源')
            if _match_context:
                # 批量择优下载
                downloads, lefts = self.downloadchain.batch_download(contexts=_match_context, no_exists=no_exists)
                if downloads and not lefts:
                    # 全部下载完成
                    logger.info(f'{mediainfo.title_year} 下载完成，完成订阅')
                    self.subscribehelper.delete(subscribe.id)
                    # 发送通知
                    self.post_message(title=f'{mediainfo.title_year}{meta.season} 已完成订阅',
                                      image=mediainfo.get_message_image())
                else:
                    # 未完成下载，计算剩余集数
                    self.__upate_lack_episodes(lefts=lefts, subscribe=subscribe, mediainfo=mediainfo)
            else:
                # 未搜索到资源，但本地缺失可能有变化，更新订阅剩余集数
                self.__upate_lack_episodes(lefts=no_exists, subscribe=subscribe, mediainfo=mediainfo)

    def __upate_lack_episodes(self, lefts: Dict[int, Dict[int, NotExistMediaInfo]],
                              subscribe: Subscribe,
                              mediainfo: MediaInfo):
        """
        更新订阅剩余集数
        """
        left_seasons = lefts.get(mediainfo.tmdb_id) or {}
        for season_info in left_seasons.values():
            season = season_info.season
            if season == subscribe.season:
                left_episodes = season_info.episodes
                logger.info(f'{mediainfo.title_year} 季 {season} 未搜索到资源，'
                            f'更新缺失集数为{len(left_episodes)} ...')
                self.subscribehelper.update(subscribe.id, {
                    "lack_episode": len(left_episodes)
                })

    def remote_list(self, userid: Union[str, int] = None):
        """
        查询订阅并发送消息
        """
        subscribes = self.subscribehelper.list()
        if not subscribes:
            self.post_message(title='没有任何订阅！', userid=userid)
            return
        title = f"共有 {len(subscribes)} 个订阅，回复对应指令操作： " \
                f"\n- 删除订阅：/subscribe_delete [id]" \
                f"\n- 搜索订阅：/subscribe_search [id]" \
                f"\n- 刷新订阅：/subscribe_refresh"
        messages = []
        for subscribe in subscribes:
            if subscribe.type == MediaType.MOVIE.value:
                tmdb_link = f"https://www.themoviedb.org/movie/{subscribe.tmdbid}"
                messages.append(f"{subscribe.id}. [{subscribe.name}（{subscribe.year}）]({tmdb_link})")
            else:
                tmdb_link = f"https://www.themoviedb.org/tv/{subscribe.tmdbid}"
                messages.append(f"{subscribe.id}. [{subscribe.name}（{subscribe.year}）]({tmdb_link}) "
                                f"第{subscribe.season}季 "
                                f"_{subscribe.total_episode - (subscribe.lack_episode or subscribe.total_episode)}"
                                f"/{subscribe.total_episode}_")
        # 发送列表
        self.post_message(title=title, text='\n'.join(messages), userid=userid)

    def remote_delete(self, arg_str: str, userid: Union[str, int] = None):
        """
        删除订阅
        """
        if not arg_str:
            self.post_message(title="请输入正确的命令格式：/subscribe_delete [id]，"
                                    "[id]为订阅编号", userid=userid)
            return
        arg_str = arg_str.strip()
        if not arg_str.isdigit():
            return
        subscribe_id = int(arg_str)
        subscribe = self.subscribehelper.get(subscribe_id)
        if not subscribe:
            self.post_message(title=f"订阅编号 {subscribe_id} 不存在！", userid=userid)
            return
        # 删除订阅
        self.subscribehelper.delete(subscribe_id)
        # 重新发送消息
        self.remote_list()

    @staticmethod
    def __get_subscribe_no_exits(no_exists: Dict[int, Dict[int, NotExistMediaInfo]],
                                 tmdb_id: int,
                                 begin_season: int,
                                 total_episode: int,
                                 start_episode: int):
        """
        根据订阅开始集数和总结数，结合TMDB信息计算当前订阅的缺失集数
        :param no_exists: 缺失季集列表
        :param tmdb_id: TMDB ID
        :param begin_season: 开始季
        :param total_episode: 总集数
        :param start_episode: 开始集数
        """
        # 使用订阅的总集数和开始集数替换no_exists
        if no_exists \
                and no_exists.get(tmdb_id) \
                and (total_episode or start_episode):
            no_exist_season = no_exists.get(tmdb_id).get(begin_season)
            if no_exist_season:
                # 原季集列表
                episode_list = no_exist_season.episodes
                # 原总集数
                total = no_exist_season.total_episodes
                if total_episode and start_episode:
                    # 有开始集和总集数
                    episodes = list(range(start_episode, total_episode + 1))
                    no_exists[tmdb_id][begin_season] = NotExistMediaInfo(
                        season=begin_season,
                        episodes=episodes,
                        total_episodes=total_episode,
                        start_episode=start_episode
                    )
                elif not start_episode:
                    # 有总集数没有开始集
                    episodes = list(range(min(episode_list or [1]), total_episode + 1))
                    no_exists[tmdb_id][begin_season] = NotExistMediaInfo(
                        season=begin_season,
                        episodes=episodes,
                        total_episodes=total_episode,
                        start_episode=min(episode_list or [1])
                    )
                elif not total_episode:
                    # 有开始集没有总集数
                    episodes = list(range(start_episode, max(episode_list or [total]) + 1))
                    no_exists[tmdb_id][begin_season] = NotExistMediaInfo(
                        season=begin_season,
                        episodes=episodes,
                        total_episodes=max(episode_list or [total]),
                        start_episode=start_episode
                    )
        return no_exists