add unittest

jackyYang6 · jackyYang6 · commit c2225f5a6a11 · 2026-02-09T12:01:20.000+08:00
diff --git a/tests/model_executor/test_thinking_budget.py b/tests/model_executor/test_thinking_budget.py
@@ -1,4 +1,5 @@
 import unittest
+from collections import OrderedDict
 from dataclasses import asdict  # Import asdict
 from types import SimpleNamespace
 from unittest.mock import MagicMock, patch  # Import MagicMock
@@ -783,6 +784,242 @@ def test_common_engine_line_break_id_from_dict(self):
         with self.assertRaises(RuntimeError):
             common_engine_module.EngineService._start_worker_service(engine)
 
+    def test_text_encode_with_cache_branches(self):
+        processor = TextDataProcessor.__new__(TextDataProcessor)
+        processor._tokenize_cache = OrderedDict()
+        processor._tokenize_cache_capacity = 1
+        call_counter = {"np": 0, "iter": 0}
+
+        def _text2ids(text, max_model_len=None, add_special_tokens=False):
+            if text == "np":
+                call_counter["np"] += 1
+                return np.array([11, 12], dtype=np.int64)
+            call_counter["iter"] += 1
+            return (v for v in [21, 22])
+
+        processor.text2ids = _text2ids
+
+        self.assertEqual(processor.encode_with_cache("np"), [11, 12])
+        self.assertEqual(processor.encode_with_cache("np"), [11, 12])
+        self.assertEqual(call_counter["np"], 1)
+        self.assertEqual(processor.encode_with_cache("iter"), [21, 22])
+        self.assertNotIn(("np", False), processor._tokenize_cache)
+
+    def test_v1_encode_with_cache_branches(self):
+        processor = V1TextDataProcessor.__new__(V1TextDataProcessor)
+        processor._tokenize_cache = OrderedDict()
+        processor._tokenize_cache_capacity = 1
+        call_counter = {"np": 0, "iter": 0}
+
+        def _text2ids(text, max_model_len=None, add_special_tokens=False):
+            if text == "np":
+                call_counter["np"] += 1
+                return np.array([31, 32], dtype=np.int64)
+            call_counter["iter"] += 1
+            return (v for v in [41, 42])
+
+        processor.text2ids = _text2ids
+
+        self.assertEqual(processor.encode_with_cache("np"), [31, 32])
+        self.assertEqual(processor.encode_with_cache("np"), [31, 32])
+        self.assertEqual(call_counter["np"], 1)
+        self.assertEqual(processor.encode_with_cache("iter"), [41, 42])
+        self.assertNotIn(("np", False), processor._tokenize_cache)
+
+    def test_text_update_thinking_prompt_state_branches(self):
+        processor = TextDataProcessor.__new__(TextDataProcessor)
+        processor._think_token_ids = None
+        processor.tokenizer = DummyTokenizerForTextProcessor()
+
+        self.assertEqual(processor._update_thinking_prompt_state([1], "not-dict"), "not-dict")
+        self.assertEqual(
+            processor._update_thinking_prompt_state([1], {"thinking_budget": -1}), {"thinking_budget": -1}
+        )
+        self.assertEqual(
+            processor._update_thinking_prompt_state([1], {"thinking_budget": 1, "think_prompt_checked": True}),
+            {"thinking_budget": 1, "think_prompt_checked": True},
+        )
+        self.assertEqual(processor._update_thinking_prompt_state(None, {"thinking_budget": 1}), {"thinking_budget": 1})
+        self.assertEqual(processor._update_thinking_prompt_state([], {"thinking_budget": 1}), {"thinking_budget": 1})
+
+        processor.tokenizer = SimpleNamespace(get_vocab=lambda: {})
+        self.assertEqual(processor._update_thinking_prompt_state([1], {"thinking_budget": 1}), {"thinking_budget": 1})
+
+        processor._think_token_ids = None
+        processor.tokenizer = DummyTokenizerForTextProcessor()
+        without_start = processor._update_thinking_prompt_state(
+            [999, 998],
+            {"thinking_budget": 1, "think_prompt_last_token_id": 777},
+        )
+        self.assertTrue(without_start["think_prompt_checked"])
+        self.assertFalse(without_start["think_prompt_started"])
+        self.assertNotIn("think_prompt_last_token_id", without_start)
+
+        with_start_no_end = processor._update_thinking_prompt_state(
+            np.array([1, THINKING_START_TOKEN_ID, 2, 3], dtype=np.int64),
+            {"thinking_budget": 4},
+        )
+        self.assertTrue(with_start_no_end["think_prompt_started"])
+        self.assertFalse(with_start_no_end["think_prompt_ended"])
+        self.assertEqual(with_start_no_end["think_prompt_tokens_after_start"], 2)
+        self.assertEqual(with_start_no_end["think_prompt_last_token_id"], 3)
+
+        # 命中 _get_think_token_ids 的缓存分支
+        self.assertEqual(processor._get_think_token_ids(), (THINKING_START_TOKEN_ID, THINKING_END_TOKEN_ID))
+
+    def test_v1_update_thinking_prompt_state_branches(self):
+        processor = V1TextDataProcessor.__new__(V1TextDataProcessor)
+        processor._think_token_ids = None
+        processor.tokenizer = DummyTokenizerForTextProcessor()
+
+        self.assertEqual(processor._update_thinking_prompt_state([1], "not-dict"), "not-dict")
+        self.assertEqual(
+            processor._update_thinking_prompt_state([1], {"thinking_budget": -1}), {"thinking_budget": -1}
+        )
+        self.assertEqual(processor._update_thinking_prompt_state(None, {"thinking_budget": 1}), {"thinking_budget": 1})
+
+        with_start_no_end = processor._update_thinking_prompt_state(
+            np.array([1, THINKING_START_TOKEN_ID, 2, 3], dtype=np.int64),
+            {"thinking_budget": 4},
+        )
+        self.assertTrue(with_start_no_end["think_prompt_started"])
+        self.assertFalse(with_start_no_end["think_prompt_ended"])
+        self.assertEqual(with_start_no_end["think_prompt_tokens_after_start"], 2)
+        self.assertEqual(with_start_no_end["think_prompt_last_token_id"], 3)
+
+        # 命中 _get_think_token_ids 的缓存分支
+        self.assertEqual(processor._get_think_token_ids(), (THINKING_START_TOKEN_ID, THINKING_END_TOKEN_ID))
+
+    def test_text_process_request_think_stop_sentence(self):
+        processor = TextDataProcessor.__new__(TextDataProcessor)
+        processor._apply_default_parameters = lambda request: request
+        processor.eos_token_ids = [1]
+        processor.update_stop_seq = lambda *args, **kwargs: None
+        processor.update_bad_words = lambda bad_words, bad_words_token_ids: bad_words_token_ids
+        processor.encode_with_cache = lambda text, *args, **kwargs: [23] if text == "\n" else [101, 102]
+        processor._update_thinking_prompt_state = lambda prompt_token_ids, args: args
+        processor.reasoning_parser = None
+
+        request = DummyRequestV1(
+            request_id="req_text",
+            eos_token_ids=[1],
+            prompt_token_ids=[8],
+            prompt=None,
+            messages=None,
+            logits_processors_args={"thinking_budget": 20, "think_stop_sentence": "done"},
+            bad_words=None,
+            bad_words_token_ids=None,
+            max_tokens=1,
+            temperature=1.0,
+            top_p=0.9,
+        )
+        with patch("fastdeploy.input.text_processor.process_stop_token_ids", lambda *args, **kwargs: None):
+            processed = processor.process_request(request, max_model_len=16)
+        self.assertEqual(
+            processed.logits_processors_args.get("think_stop_sentence_token_ids"),
+            [23, 101, 102],
+        )
+        self.assertNotIn("think_stop_sentence", processed.logits_processors_args)
+
+    def test_text_process_request_dict_think_stop_sentence(self):
+        processor = TextDataProcessor.__new__(TextDataProcessor)
+        processor._apply_default_parameters = lambda request: request
+        processor.eos_token_ids = [1]
+        processor.update_stop_seq = lambda *args, **kwargs: None
+        processor.update_bad_words = lambda bad_words, bad_words_token_ids: bad_words_token_ids
+        processor.encode_with_cache = lambda text, *args, **kwargs: [23] if text == "\n" else [201, 202]
+        processor._update_thinking_prompt_state = lambda prompt_token_ids, args: args
+        processor.reasoning_parser = None
+
+        request = {
+            "request_id": "req_text_dict",
+            "eos_token_ids": [1],
+            "prompt_token_ids": [9],
+            "prompt": None,
+            "messages": None,
+            "bad_words": None,
+            "bad_words_token_ids": None,
+            "logits_processors_args": {"thinking_budget": 20, "think_stop_sentence": "done"},
+            "max_tokens": 1,
+            "temperature": 1.0,
+            "top_p": 0.9,
+        }
+        with patch("fastdeploy.input.text_processor.process_stop_token_ids", lambda *args, **kwargs: None):
+            processed = processor.process_request_dict(request, max_model_len=16)
+        self.assertEqual(
+            processed["logits_processors_args"].get("think_stop_sentence_token_ids"),
+            [23, 201, 202],
+        )
+        self.assertNotIn("think_stop_sentence", processed["logits_processors_args"])
+
+    def test_v1_process_request_think_stop_sentence(self):
+        processor = V1TextDataProcessor.__new__(V1TextDataProcessor)
+        processor._apply_default_parameters = lambda request: request
+        processor.eos_token_ids = [1]
+        processor.update_stop_seq = lambda *args, **kwargs: None
+        processor.update_bad_words = lambda bad_words, bad_words_token_ids: bad_words_token_ids
+        processor.encode_with_cache = lambda text, *args, **kwargs: [23] if text == "\n" else [301, 302]
+        processor._update_thinking_prompt_state = lambda prompt_token_ids, args: args
+        processor.reasoning_parser = None
+
+        request = DummyRequestV1(
+            request_id="req_v1",
+            eos_token_ids=[1],
+            prompt_token_ids=[10],
+            prompt=None,
+            messages=None,
+            logits_processors_args={"thinking_budget": 20, "think_stop_sentence": "done"},
+            bad_words=None,
+            bad_words_token_ids=None,
+            max_tokens=1,
+            temperature=1.0,
+            top_p=0.9,
+        )
+        with patch("fastdeploy.input.v1.text_processor.process_stop_token_ids", lambda *args, **kwargs: None):
+            processed = processor.process_request(request, max_model_len=16)
+        self.assertEqual(
+            processed.logits_processors_args.get("think_stop_sentence_token_ids"),
+            [23, 301, 302],
+        )
+        self.assertNotIn("think_stop_sentence", processed.logits_processors_args)
+
+    def test_v1_process_request_dict_think_stop_sentence(self):
+        processor = V1TextDataProcessor.__new__(V1TextDataProcessor)
+        processor._apply_default_parameters = lambda request: request
+        processor.eos_token_ids = [1]
+        processor.update_stop_seq = lambda *args, **kwargs: None
+        processor.update_bad_words = lambda bad_words, bad_words_token_ids: bad_words_token_ids
+        processor.encode_with_cache = lambda text, *args, **kwargs: [23] if text == "\n" else [401, 402]
+        processor._update_thinking_prompt_state = lambda prompt_token_ids, args: args
+        processor.reasoning_parser = None
+
+        request = DummyRequestV1(
+            request_id="req_v1_dict",
+            eos_token_ids=[1],
+            prompt_token_ids=[11],
+            prompt=None,
+            messages=None,
+            chat_template_kwargs=None,
+            sampling_params=SimpleNamespace(
+                bad_words=None,
+                bad_words_token_ids=None,
+                max_tokens=1,
+                temperature=1.0,
+                top_p=0.9,
+                repetition_penalty=1.0,
+                frequency_penalty=0.0,
+                presence_penalty=0.0,
+                logits_processors_args={"thinking_budget": 20, "think_stop_sentence": "done"},
+            ),
+        )
+        with patch("fastdeploy.input.v1.text_processor.process_stop_token_ids", lambda *args, **kwargs: None):
+            processed = processor.process_request_dict(request, max_model_len=16)
+        self.assertEqual(
+            processed.sampling_params.logits_processors_args.get("think_stop_sentence_token_ids"),
+            [23, 401, 402],
+        )
+        self.assertNotIn("think_stop_sentence", processed.sampling_params.logits_processors_args)
+
 
 if __name__ == "__main__":
     unittest.main()