spring-ai-alibaba
diff --git a/‎pom.xml‎
Lines changed: 6 additions & 7 deletions b/‎pom.xml‎
Lines changed: 6 additions & 7 deletions
diff --git a/‎spring-ai-alibaba-agent-example/playground-flight-booking/src/main/java/ai/spring/demo/ai/playground/services/CustomerSupportAssistant.java‎
Lines changed: 1 addition & 1 deletion b/‎spring-ai-alibaba-agent-example/playground-flight-booking/src/main/java/ai/spring/demo/ai/playground/services/CustomerSupportAssistant.java‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎spring-ai-alibaba-audio-example/dashscope-audio/dashscope-audio.http‎
Lines changed: 3 additions & 6 deletions b/‎spring-ai-alibaba-audio-example/dashscope-audio/dashscope-audio.http‎
Lines changed: 3 additions & 6 deletions
diff --git a/‎spring-ai-alibaba-audio-example/dashscope-audio/src/main/java/com/alibaba/cloud/ai/example/audio/AudioSpeechController.java‎
Lines changed: 4 additions & 2 deletions b/‎spring-ai-alibaba-audio-example/dashscope-audio/src/main/java/com/alibaba/cloud/ai/example/audio/AudioSpeechController.java‎
Lines changed: 4 additions & 2 deletions
diff --git a/‎spring-ai-alibaba-audio-example/dashscope-audio/src/main/java/com/alibaba/cloud/ai/example/audio/AudioTranscriptionController.java‎
Lines changed: 26 additions & 98 deletions b/‎spring-ai-alibaba-audio-example/dashscope-audio/src/main/java/com/alibaba/cloud/ai/example/audio/AudioTranscriptionController.java‎
Lines changed: 26 additions & 98 deletions
diff --git a/‎spring-ai-alibaba-chat-example/ollama-chat/src/main/java/com/alibaba/cloud/ai/example/chat/ollama/controller/OllamaChatClientController.java‎
Lines changed: 3 additions & 2 deletions b/‎spring-ai-alibaba-chat-example/ollama-chat/src/main/java/com/alibaba/cloud/ai/example/chat/ollama/controller/OllamaChatClientController.java‎
Lines changed: 3 additions & 2 deletions
@@ -41,14 +41,14 @@
 		<maven.compiler.target>17</maven.compiler.target>
 
 		<!-- Spring AI -->
-		<spring-ai.version>1.1.0-M4</spring-ai.version>
+		<spring-ai.version>1.1.0</spring-ai.version>
+		<!-- Spring Boot -->
+		<spring-boot.version>3.5.7</spring-boot.version>
 
 		<!-- Spring AI Alibaba -->
 		<!-- Install Spring AI Alibaba in your local. -->
-		<spring-ai-alibaba.version>1.1.0.0-M4</spring-ai-alibaba.version>
-		<spring-ai-extensions.version>1.1.0.0-M4</spring-ai-extensions.version>
-		<!-- Spring Boot -->
-		<spring-boot.version>3.4.0</spring-boot.version>
+		<spring-ai-alibaba.version>1.1.0.0-M5</spring-ai-alibaba.version>
+		<spring-ai-alibaba.extensions.version>1.1.0.0-M5</spring-ai-alibaba.extensions.version>
 
 		<!-- maven plugin -->
 		<maven-deploy-plugin.version>3.1.1</maven-deploy-plugin.version>
@@ -109,11 +109,10 @@
             <dependency>
                 <groupId>com.alibaba.cloud.ai</groupId>
                 <artifactId>spring-ai-alibaba-extensions-bom</artifactId>
-                <version>${spring-ai-extensions.version}</version>
+                <version>${spring-ai-alibaba.extensions.version}</version>
                 <type>pom</type>
                 <scope>import</scope>
             </dependency>
-			
 		</dependencies>
 	</dependencyManagement>
 
 
@@ -67,7 +67,7 @@ public CustomerSupportAssistant(ChatClient.Builder modelBuilder, VectorStore vec
 						PromptChatMemoryAdvisor.builder(chatMemory).build(), // Chat Memory
 						// new VectorStoreChatMemoryAdvisor(vectorStore)),
 
-						new QuestionAnswerAdvisor(vectorStore), // RAG
+						QuestionAnswerAdvisor.builder(vectorStore).build(), // RAG
 						// new QuestionAnswerAdvisor(vectorStore, SearchRequest.defaults()
 						// 	.withFilterExpression("'documentType' == 'terms-of-service' && region in ['EU', 'US']")),
 
 
@@ -1,18 +1,15 @@
 # Aduio Transcription API
 
-### STT(speech to text) API
-GET http://127.0.0.1:10009/ai/transcription
+### STT(speech to text) call API
+GET http://127.0.0.1:10009/ai/transcription/call
 
 ### STT(speech to text) stream API
 GET http://127.0.0.1:10009/ai/transcription/stream
 
-### STT(speech to text) async API
-GET http://127.0.0.1:10009/ai/transcription/async
-
 # Audio Speech API
 
 ### TTS(text to speech) API
-GET http://127.0.0.1:10009/ai/speech
+GET http://127.0.0.1:10009/ai/speech/call
 
 ### TTS(text to speech) stream API
 GET http://127.0.0.1:10009/ai/speech/stream
@@ -22,6 +22,8 @@
 import com.alibaba.cloud.ai.dashscope.audio.synthesis.SpeechSynthesisPrompt;
 import com.alibaba.cloud.ai.dashscope.audio.synthesis.SpeechSynthesisResponse;
 import jakarta.annotation.PreDestroy;
+
+import com.alibaba.cloud.ai.dashscope.spec.DashScopeModel;
 import org.apache.commons.io.FileUtils;
 import org.springframework.boot.ApplicationArguments;
 import org.springframework.boot.ApplicationRunner;
@@ -64,7 +66,7 @@ public void tts() throws IOException {
 				new SpeechSynthesisPrompt(
 						TEXT,
 						DashScopeAudioSpeechOptions.builder()
-								.model(DashScopeAudioSpeechApi.AudioSpeechModel.SAM_BERT_ZHICHU_V1.getValue())
+								.model(DashScopeModel.AudioModel.SAMBERT_ZHICHU_V1.getValue())
 								.build()
 						)
 		);
@@ -86,7 +88,7 @@ public void streamTTS() {
 				new SpeechSynthesisPrompt(
 						TEXT,
 						DashScopeAudioSpeechOptions.builder()
-								.model(DashScopeAudioSpeechApi.AudioSpeechModel.SAM_BERT_ZHITING_V1.getValue())
+								.model(DashScopeModel.AudioModel.SAMBERT_ZHITING_V1.getValue())
 								.build()
 				)
 		);
 
@@ -16,27 +16,25 @@
 
 package com.alibaba.cloud.ai.example.audio;
 
-import com.alibaba.cloud.ai.dashscope.api.DashScopeAudioTranscriptionApi;
 import com.alibaba.cloud.ai.dashscope.audio.DashScopeAudioTranscriptionOptions;
 import com.alibaba.cloud.ai.dashscope.audio.transcription.AudioTranscriptionModel;
-import com.alibaba.cloud.ai.dashscope.common.DashScopeException;
+import com.alibaba.cloud.ai.dashscope.spec.DashScopeModel;
 import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
+import org.springframework.ai.audio.transcription.AudioTranscription;
 import org.springframework.ai.audio.transcription.AudioTranscriptionPrompt;
 import org.springframework.ai.audio.transcription.AudioTranscriptionResponse;
-import org.springframework.core.io.FileSystemResource;
+import org.springframework.core.io.ClassPathResource;
+import org.springframework.core.io.DefaultResourceLoader;
+import org.springframework.core.io.Resource;
 import org.springframework.web.bind.annotation.GetMapping;
 import org.springframework.web.bind.annotation.RequestMapping;
 import org.springframework.web.bind.annotation.RestController;
 import reactor.core.publisher.Flux;
 
-import java.nio.file.Path;
-import java.nio.file.Paths;
-import java.util.Objects;
-import java.util.concurrent.CountDownLatch;
 import java.util.concurrent.Executors;
 import java.util.concurrent.ScheduledExecutorService;
-import java.util.concurrent.TimeUnit;
+import java.util.stream.Collectors;
 
 /**
  * 语音转文本（语音合成）
@@ -53,7 +51,7 @@ public class AudioTranscriptionController {
 	private static final Logger log = LoggerFactory.getLogger(AudioTranscriptionController.class);
 
 	// 模型列表：https://help.aliyun.com/zh/model-studio/sambert-websocket-api
-	private static final String DEFAULT_MODEL = DashScopeAudioTranscriptionApi.AudioTranscriptionModel.PARAFORMER_REALTIME_V2.getValue();
+	private static final String DEFAULT_MODEL = DashScopeModel.AudioModel.PARAFORMER_V2.getValue();
 
 	private final ScheduledExecutorService scheduler = Executors.newScheduledThreadPool(1);
 
@@ -62,15 +60,20 @@ public AudioTranscriptionController(AudioTranscriptionModel transcriptionModel)
 		this.transcriptionModel = transcriptionModel;
 	}
 
-	@GetMapping
-	public String stt() {
+	/**
+	 * 录音文件识别
+	 */
+	@GetMapping("/call")
+	public String callSTT() {
 
-		String currentDir = System.getProperty("user.dir");
-		Path filePath = Paths.get(currentDir, "hello_world_male_16k_16bit_mono.wav");
+		// 录音文件支持HTTP / HTTPS协议
+		// 若录音文件存储在阿里云OSS，使用RESTful API方式支持使用以 oss://为前缀的临时 URL
+		Resource resource = new DefaultResourceLoader()
+			.getResource("https://dashscope.oss-cn-beijing.aliyuncs.com/samples/audio/paraformer/hello_world_female2.wav");
 
 		AudioTranscriptionResponse response = transcriptionModel.call(
 				new AudioTranscriptionPrompt(
-						new FileSystemResource(filePath),
+						resource,
 						DashScopeAudioTranscriptionOptions.builder()
 								.withModel(DEFAULT_MODEL)
 								.build()
@@ -81,104 +84,29 @@ public String stt() {
 	}
 
 	/**
-	 * 以 Audio Speech 的输出作为输入
+	 * 实时语音识别
 	 */
 	@GetMapping("/stream")
 	public String streamSTT() {
 
-		String currentDir = System.getProperty("user.dir");
-		Path filePath = Paths.get(currentDir, "spring-ai-alibaba-audio-example/dashscope-audio/src/main/resources/gen/tts/output.mp3");
-
-		CountDownLatch latch = new CountDownLatch(1);
-		StringBuilder stringBuilder = new StringBuilder();
-
+		ClassPathResource audioResource = new ClassPathResource("hello_world_male_16k_16bit_mono.wav");
 		Flux<AudioTranscriptionResponse> response = transcriptionModel
 				.stream(
 						new AudioTranscriptionPrompt(
-								new FileSystemResource(filePath),
+								audioResource,
 								DashScopeAudioTranscriptionOptions.builder()
-										.withModel(DEFAULT_MODEL)
+										.withModel("paraformer-realtime-v2")
 										.withSampleRate(16000)
-										.withFormat(DashScopeAudioTranscriptionOptions.AudioFormat.PCM)
+										.withFormat(DashScopeAudioTranscriptionOptions.AudioFormat.WAV)
 										.withDisfluencyRemovalEnabled(false)
 										.build()
 						)
 				);
 
-		response.doFinally(
-				signal -> latch.countDown()
-		).subscribe(
-				resp -> stringBuilder.append(resp.getResult().getOutput())
-		);
-
-		try {
-			latch.await();
-		}
-		catch (InterruptedException e) {
-			throw new RuntimeException(e);
-		}
-
-		return stringBuilder.toString();
-	}
-
-	@GetMapping("/async")
-	public String asyncSTT() {
-		StringBuilder stringBuilder = new StringBuilder();
-		CountDownLatch latch = new CountDownLatch(1);
-
-		String currentDir = System.getProperty("user.dir");
-		Path filePath = Paths.get(currentDir, "spring-ai-alibaba-audio-example/dashscope-audio/src/main/resources/gen/tts/output-stream.mp3");
-
-		try {
-			AudioTranscriptionResponse submitResponse = transcriptionModel.asyncCall(
-					new AudioTranscriptionPrompt(
-							new FileSystemResource(filePath),
-							DashScopeAudioTranscriptionOptions.builder()
-									.withModel(DEFAULT_MODEL)
-									.build()
-					)
-			);
-
-			DashScopeAudioTranscriptionApi.Response.Output submitOutput = Objects.requireNonNull(submitResponse.getMetadata()
-					.get("output"));
-			String taskId = submitOutput.taskId();
-
-			scheduler.scheduleAtFixedRate(
-					() -> checkTaskStatus(taskId, stringBuilder, latch), 0, 1, TimeUnit.SECONDS);
-			latch.await();
-
-		} catch (InterruptedException e) {
-			Thread.currentThread().interrupt();
-			throw new DashScopeException("Thread was interrupted: " + e.getMessage());
-		}
-		finally {
-			scheduler.shutdown();
-		}
-
-		return stringBuilder.toString();
-	}
-
-	private void checkTaskStatus(String taskId, StringBuilder stringBuilder, CountDownLatch latch) {
-
-		try {
-			AudioTranscriptionResponse fetchResponse = transcriptionModel.fetch(taskId);
-			DashScopeAudioTranscriptionApi.Response.Output fetchOutput =
-					Objects.requireNonNull(fetchResponse.getMetadata().get("output"));
-			DashScopeAudioTranscriptionApi.TaskStatus taskStatus = fetchOutput.taskStatus();
-
-			if (taskStatus.equals(DashScopeAudioTranscriptionApi.TaskStatus.SUCCEEDED)) {
-				stringBuilder.append(fetchResponse.getResult().getOutput());
-				latch.countDown();
-			}
-			else if (taskStatus.equals(DashScopeAudioTranscriptionApi.TaskStatus.FAILED)) {
-				log.warn("Transcription failed.");
-				latch.countDown();
-			}
-		}
-		catch (Exception e) {
-			latch.countDown();
-			throw new RuntimeException("Error occurred while checking task status: " + e.getMessage());
-		}
+		return response.map(AudioTranscriptionResponse::getResult)
+			.map(AudioTranscription::getOutput)
+			.collect(Collectors.joining())
+			.block();
 	}
 
 }
@@ -17,12 +17,13 @@
 package com.alibaba.cloud.ai.example.chat.ollama.controller;
 
 import jakarta.servlet.http.HttpServletResponse;
+
+import org.springframework.ai.ollama.api.OllamaChatOptions;
 import reactor.core.publisher.Flux;
 
 import org.springframework.ai.chat.client.ChatClient;
 import org.springframework.ai.chat.client.advisor.SimpleLoggerAdvisor;
 import org.springframework.ai.chat.model.ChatModel;
-import org.springframework.ai.ollama.api.OllamaOptions;
 import org.springframework.web.bind.annotation.GetMapping;
 import org.springframework.web.bind.annotation.RequestMapping;
 import org.springframework.web.bind.annotation.RestController;
@@ -51,7 +52,7 @@ public OllamaChatClientController(ChatModel chatModel) {
 				)
 				// 设置 ChatClient 中 ChatModel 的 Options 参数
 				.defaultOptions(
-						OllamaOptions.builder()
+					OllamaChatOptions.builder()
 								.topP(0.7)
 								.model("llama3")
 								.build()