การดูฉากแอ็คชั่นโดยไม่พูดจาเลยก็เหมือนกับการกินขนมปังโดยไม่ใส่เกลือ: ดนตรีคือสิ่งที่ให้พลังและเอกลักษณ์แก่สิ่งที่เราเห็นแต่ไม่ใช่ทุกคนที่จะรู้วิธีการแต่งเพลงประกอบตั้งแต่เริ่มต้น Google ต้องการเติมเต็มช่องว่างนี้ โดยได้ทดลองใช้โมเดลทางดนตรีภายในระบบนิเวศของตนมาสักระยะหนึ่งแล้ว และตอนนี้กำลังเตรียมก้าวไปอีกขั้นที่ทะเยอทะยานกว่าเดิมด้วย Gemini
การวิเคราะห์รหัสของหลายครั้งเมื่อเร็ว ๆ นี้ แอป Gemini สำหรับ Android กำลังบอกใบ้ถึงฟีเจอร์ใหม่ที่สามารถสร้างเพลงจากข้อความได้แม้จะยังไม่มีการประกาศอย่างเป็นทางการ แต่รายละเอียดทางเทคนิคค่อนข้างชัดเจนแล้ว คือ บริษัทกำลังเตรียมเครื่องมือสร้างเพลงที่ผสานรวมเข้ากับผู้ช่วยอัจฉริยะ โดยออกแบบมาเพื่อให้ทุกคนสามารถสร้างแทร็กเสียงได้โดยไม่ต้องพึ่งสตูดิโออัดเสียง เครื่องดนตรี หรือซอฟต์แวร์ที่ซับซ้อน
จากการทดลองแบบแยกส่วน สู่ฟีเจอร์หลักในแอป Gemini
ก่อนหน้านี้ Google เคยเปรยถึงความสนใจในดนตรีที่สร้างโดย AI ในโครงการที่ไม่เปิดเผยมากนัก เช่น ฟีเจอร์บางอย่างของแอปพลิเคชัน แอปบันทึกเสียงบนโทรศัพท์ Pixel รุ่นล่าสุด หรือการทดสอบแบบจำกัดร่วมกับโมเดลวิดีโออย่าง Veo ในกรณีเหล่านั้น AI จะเข้ามาช่วยเสริมภาพหรือคลิป แต่ไม่มีเครื่องมือทางดนตรีใดที่ผสานรวมเข้ากับชีวิตประจำวันของผู้ใช้ได้อย่างชัดเจน
แต่สิ่งนั้นเริ่มเปลี่ยนแปลงไปหลังจากที่ได้ค้นพบสิ่งที่... วิเคราะห์ไฟล์ APK เวอร์ชัน 17.2.51.sa.arm64 ของแอป Gemini สำหรับ Androidโค้ดดังกล่าวมีการอ้างอิงอย่างชัดเจนถึงยูทิลิตี้ภายในที่ชื่อว่า “การสร้างสรรค์ดนตรีในฐานะเครื่องมือ”ชื่อนี้สอดคล้องกับความสามารถใหม่เฉพาะด้านในการสร้างเพลงภายในผู้ช่วย ข้อเท็จจริงที่ว่าการอ้างอิงนี้ปรากฏอยู่ในแอปพลิเคชันแล้ว แม้ว่าจะยังไม่เปิดเผยต่อสาธารณะ แสดงให้เห็นว่าการพัฒนาอยู่ในขั้นที่ค่อนข้างก้าวหน้าแล้ว
นอกจากเครื่องมือนี้แล้ว ยังตรวจพบสิ่งต่อไปนี้ด้วย มีการเพิ่มหมวดหมู่ใหม่ที่เกี่ยวข้องกับดนตรีในส่วน "สิ่งของของฉัน" ในแอปพลิเคชัน Geminiพื้นที่นี้ ซึ่งออกแบบมาเพื่อจัดกลุ่มสิ่งที่ผู้ใช้สร้างขึ้นด้วย AI (ข้อความ รูปภาพ และเนื้อหาอื่นๆ) จะรวมถึงการประพันธ์เสียงด้วย ซึ่งจะทำให้สามารถ... บันทึก จัดระเบียบ และเล่นแทร็กที่สร้างขึ้น โดยไม่ต้องออกจากแอป ซึ่งสะดวกเป็นพิเศษสำหรับการนำส่วนต่างๆ ไปใช้ซ้ำในวิดีโอ พอดแคสต์ หรือการนำเสนอ
ความแปลกใหม่ที่สำคัญคือ ดนตรีจะไม่ใช่เพียงแค่การทดลองที่โดดเดี่ยวอีกต่อไป แต่จะกลายเป็นส่วนหนึ่งของ... ความสามารถพื้นฐานที่เหนือกว่าความสามารถของผู้ช่วยเสมือน เทียบเท่ากับการสร้างภาพหรือการเขียนข้อความภายในระบบนิเวศของ Gemini ความคิดสร้างสรรค์จะเคลื่อนไหวไปในสามด้านหลัก ได้แก่ ภาพ ข้อความ และตอนนี้ยังรวมถึงเสียงด้วย โดยทั้งหมดนี้รวมอยู่ในอินเทอร์เฟซเดียว

บทบาทของ Lyria และประสบการณ์ก่อนหน้านี้ของ Google ในด้านดนตรีที่ขับเคลื่อนด้วย AI
การเปลี่ยนแปลงครั้งนี้ไม่ได้เกิดขึ้นโดยไม่มีที่มาที่ไป Google ได้ทำงานเกี่ยวกับเรื่องนี้มาสักระยะแล้ว แบบจำลองเฉพาะสำหรับการประพันธ์ดนตรีโดยใช้ปัญญาประดิษฐ์- ในหมู่พวกเขาโดดเด่น ไลเรียระบบที่ออกแบบมาเพื่อสร้างสรรค์ชิ้นงานดนตรีบรรเลงและควบคุมวิวัฒนาการของชิ้นงานเหล่านั้นแบบเรียลไทม์ ซึ่งจนถึงปัจจุบันมีให้บริการส่วนใหญ่ผ่านทาง API ของ Gemini และในโครงการนำร่องร่วมกับนักพัฒนา
ด้วยเทคโนโลยี Lyria ทำให้แอปพลิเคชันจากผู้พัฒนาภายนอกสามารถอนุญาตให้ผู้ใช้ใช้งานแอปพลิเคชันของตนได้แล้ว สร้าง กำกับ และเล่นดนตรีบรรเลงแบบโต้ตอบเช่นเดียวกับที่เคยเกิดขึ้นกับ วงดนตรีที่สร้างโดย AIอย่างไรก็ตาม ในทางปฏิบัติ ความสามารถเหล่านี้ยังคงเข้าถึงได้ยากสำหรับผู้ใช้ทั่วไป เนื่องจากต้องมีการผสานรวม API ออกแบบอินเทอร์เฟซแบบกำหนดเอง และในหลายกรณีต้องมีความเชี่ยวชาญทางเทคนิคในระดับหนึ่ง ฟีเจอร์ใหม่ที่กล่าวถึงใน Gemini จะเปลี่ยนแนวทางนี้โดยนำเทคโนโลยีนี้มาสู่แอปพลิเคชันบนมือถือโดยตรง
ภายในระบบนิเวศของ Google นั้น Lyria ยังถูกนำมาใช้เป็นส่วนเสริมให้กับโมเดลต่างๆ เช่น เข้าใจแล้ว เน้นไปที่การสร้างวิดีโอเพื่อสร้างซาวด์แทร็กที่เข้ากับคลิปวิดีโอที่สร้างโดย AI ด้วยการผสานรวมดนตรีใน Gemini ทำให้ความสามารถในการประกอบภาพด้วยเสียงสังเคราะห์เป็นไปได้ เพียงแค่แตะครั้งเดียวก็ทำได้แล้วโดยไม่ต้องใช้บริการแยกต่างหากหรือปรับแต่งการตั้งค่าที่ซับซ้อน ซึ่งเป็นสิ่งที่เชื่อมโยงกับการถกเถียงเกี่ยวกับเรื่องนี้ ปัญหาเกี่ยวกับ AI บน YouTube.
กุญแจสำคัญของการเปลี่ยนแปลงนี้อยู่ที่... การเข้าถึงแทนที่จะต้องมีความรู้ด้านการเขียนโปรแกรมหรือการผลิต แนวคิดก็คือทุกคนสามารถทำได้ ขอเพลง ทำนอง หรือเสียงประกอบโดยใช้คำอธิบายที่เป็นภาษาธรรมชาติตั้งแต่ผู้สร้างคอนเทนต์ที่กำลังมองหาเพลงประกอบวิดีโอ ไปจนถึงนักเรียนที่ต้องการเพลงเพื่อช่วยให้มีสมาธิหรือเล่นกีฬา ขอบเขตการใช้งานจึงกว้างขวางทั้งในสเปนและในส่วนอื่นๆ ของยุโรป
จากมุมมองเชิงกลยุทธ์ การที่ Gemini เพิ่มฟีเจอร์นี้เข้ามาเป็นการตอกย้ำความมุ่งมั่นของ Google ในการสร้างผู้ช่วยที่ทำหน้าที่เสมือนเป็นผู้ใช้งานจริง ศูนย์สร้างสรรค์แบบบูรณาการบริษัทนี้ไม่ได้แข่งขันเฉพาะในด้านการตอบโต้แบบสนทนาเท่านั้น แต่ยังแข่งขันในด้านเครื่องมือที่ช่วยในการผลิตเนื้อหามัลติมีเดีย ซึ่งเป็นพื้นที่ที่ดนตรีที่สร้างโดย AI สามารถสร้างความแตกต่างเมื่อเทียบกับบริการอื่นๆ ได้
การสร้างเพลงจากข้อความจะทำได้อย่างไร?
แม้ว่าอินเทอร์เฟซสุดท้ายจะยังไม่ได้รับการเปิดเผยต่อสาธารณะ แต่ข้อมูลอ้างอิงที่พบและความคล้ายคลึงกับฟังก์ชันอื่นๆ ของ Gemini ทำให้เราสามารถจินตนาการถึงรูปแบบการใช้งานที่ค่อนข้างชัดเจนได้ เป็นไปได้มากว่าผู้ใช้จะต้อง... เขียนคำอธิบายเกี่ยวกับประเภทของดนตรีที่คุณต้องการคล้ายกับการขอรูปภาพ ตัวอย่างเช่น “เพลงร็อคยุค 80 ที่สร้างแรงบันดาลใจสำหรับการออกกำลังกาย” “เพลงประกอบสุดอลังการสำหรับตัวอย่างภาพยนตร์” หรือ “เพลงอิเล็กทรอนิกส์เบาๆ สำหรับอ่านหนังสือตอนกลางคืน”
จากคำอธิบายดังกล่าว ผู้ช่วยจะนำความสามารถของตนมาผสานรวมกันดังนี้ ตีความภาษาธรรมชาติด้วยรูปแบบดนตรีพื้นฐานสร้างชิ้นงานที่เข้ากับสไตล์ บรรยากาศ และอาจรวมถึงระยะเวลาที่กำหนดไว้ ประสบการณ์จะคล้ายคลึงกับเครื่องมือสร้างภาพที่คุ้นเคย กล่าวคือ ผู้ใช้พิมพ์ข้อความสองสามบรรทัด รอไม่กี่วินาที แล้วก็จะได้รับผลลัพธ์ที่พร้อมฟังได้ทันที
รหัสที่วิเคราะห์ยังบ่งชี้ว่าอาจมีบางอย่าง การควบคุมพื้นฐานเพื่อปรับแต่งผลลัพธ์ให้ดียิ่งขึ้นอาจเป็นการปรับความเข้มข้น เครื่องดนตรีหลัก การมีหรือไม่มีเสียงร้องสังเคราะห์ หรือการเปลี่ยนแปลงในแนวคิดทางดนตรีเดียว รายละเอียดต่างๆ ยังไม่ได้รับการยืนยัน แต่ก็สอดคล้องกับแนวทางของ Google ที่นำเสนออินเทอร์เฟซที่เรียบง่าย พร้อมตัวเลือกที่น้อยแต่ใช้งานได้จริง
อีกองค์ประกอบที่สำคัญคือหมวดหมู่เพลงภายใน “สิ่งของของฉัน” จากตรงนั้นผู้ใช้สามารถเลือกดูได้ บันทึกเพลงในเวอร์ชันต่างๆ จัดระเบียบโปรเจ็กต์เสียงของคุณ และเล่นซ้ำได้ทุกเมื่อที่ต้องการราวกับเป็นคลังเพลงส่วนตัวขนาดเล็กที่สร้างขึ้นด้วย AI พื้นที่นี้ยังช่วยให้การปรับปรุงงานเก่าหรือการแชร์ส่วนต่างๆ ระหว่างบริการอื่นๆ ในระบบนิเวศของ Google ทำได้ง่ายขึ้นอีกด้วย
ไม่ว่าการออกแบบขั้นสุดท้ายจะเป็นอย่างไร เจตนาดูเหมือนจะชัดเจน: คือการนำความรวดเร็วทันใจแบบเดียวกันมาสู่เสียง เช่นเดียวกับที่เกิดขึ้นแล้วในการสร้างภาพและข้อความหากระบบใช้งานง่ายและเข้าใจง่าย ผู้ใช้จำนวนมากก็มีแนวโน้มที่จะบูรณาการการสร้างสรรค์ดนตรีเข้ากับการใช้งาน Gemini ในชีวิตประจำวัน ไม่ว่าจะเป็นการส่งข้อความพร้อมทำนองเพลงส่วนตัว หรือเพื่อใช้ประกอบโปรเจกต์ที่ซับซ้อนยิ่งขึ้น
ข้อจำกัด การเข้าถึง และตัวกรองลิขสิทธิ์ที่เป็นไปได้
ข้อความที่พบในแอปพลิเคชันยังบ่งชี้ถึงความเป็นไปได้อีกด้วย ข้อจำกัดการเข้าถึงตามประเภทบัญชีเป็นไปได้ว่าเครื่องมือดนตรีใหม่นี้ในระยะเริ่มต้นอาจจะเชื่อมโยงกับการสมัครสมาชิกแบบเสียค่าใช้จ่าย เช่นเดียวกับของ ราศีเมถุนขั้นสูง หรือแพ็กเกจ Google One ที่มีฟีเจอร์ AI เพิ่มเติม เพื่อให้ผู้ใช้ฟรีสามารถเข้าถึงได้ในวงจำกัด หรือสามารถล็อกอินในภายหลังได้
ในขณะเดียวกัน ทุกอย่างบ่งชี้ว่าแผนดังกล่าวจะถูกนำไปปฏิบัติ ตัวกรองเพื่อป้องกันการสร้างเพลงที่มีความคล้ายคลึงกับผลงานเชิงพาณิชย์ที่มีอยู่แล้วมากเกินไป หรือการเลียนแบบเสียงของศิลปินคนใดคนหนึ่งโดยไม่ได้รับอนุญาต อุตสาหกรรมดนตรี หน่วยงานต่างๆ ได้ให้ความสนใจเป็นพิเศษกับการเกิดขึ้นของปัญญาประดิษฐ์ (AI) มาเป็นเวลาหลายเดือนแล้ว โดยเฉพาะในยุโรป กรอบกฎหมายที่เกี่ยวข้องกับลิขสิทธิ์และการใช้ข้อมูล จึงจำเป็นต้องใช้ความระมัดระวังในการใช้เครื่องมือประเภทนี้
เป็นเรื่องสมเหตุสมผลที่จะคิดว่าฟีเจอร์นี้จะสร้างข้อจำกัดเมื่อผู้ใช้พยายามขอสิ่งต่างๆ เช่น "เพลงที่คล้ายกับศิลปินคนนั้น" หรือ "เสียงที่เหมือนกับนักร้องคนนั้น" โดยไม่ได้รับอนุญาต อันที่จริง Google น่าจะบังคับใช้กฎนี้ นโยบายต่อต้านเพลงที่สร้างโดยปัญญาประดิษฐ์ เพื่อป้องกันการละเมิด กฎระเบียบของสหภาพยุโรปเองกำหนดให้ต้องมีความโปร่งใสในแบบจำลอง AI และต้องระมัดระวังในการใช้เนื้อหาที่ได้รับการคุ้มครอง ดังนั้น Google จะต้องสร้างสมดุลระหว่างความยืดหยุ่นในการสร้างสรรค์กับการเคารพในทรัพย์สินทางปัญญา หากคุณต้องการใช้งานเครื่องมือนี้โดยไม่มีปัญหาทางกฎหมายในสหภาพยุโรป
นอกเหนือจากข้อจำกัดด้านสิทธิ์แล้ว ยังต้องดูกันต่อไปว่าจะมีข้อจำกัดใดเพิ่มเติมอีกหรือไม่ ข้อจำกัดเกี่ยวกับระยะเวลาของแทร็กหรือจำนวนเพลงที่สามารถสร้างได้ในระยะเวลาที่กำหนดนี่เป็นแนวปฏิบัติทั่วไปในบริการ AI ขั้นสูง ข้อจำกัดเหล่านี้มีไว้เพื่อควบคุมการใช้ทรัพยากรและจัดการภาระงานบนเซิร์ฟเวอร์ในระหว่างที่กำลังพัฒนาฟีเจอร์นี้
สำหรับผู้ใช้งานทั่วไป โดยเฉพาะผู้สร้างเนื้อหาในสเปนและประเทศอื่นๆ ในยุโรป ประเด็นสำคัญคือการทำความเข้าใจ ภายใต้เงื่อนไขใดบ้างที่พวกเขาสามารถนำเพลงที่สร้างโดย Gemini กลับมาใช้ใหม่ได้?หากบริษัทชี้แจงให้ชัดเจนว่าสามารถใช้แทร็กเสียงเหล่านี้ได้อย่างอิสระบนโซเชียลมีเดีย พอดแคสต์ หรือโครงการเชิงพาณิชย์ เครื่องมือนี้ก็อาจกลายเป็นแหล่งข้อมูลที่น่าสนใจอย่างมากเมื่อเทียบกับคลังเสียงแบบดั้งเดิมหรือโซลูชันจากบุคคลที่สาม

สถานะการพัฒนา การนำไปใช้ และผลกระทบที่อาจเกิดขึ้นในยุโรปและสเปน
ในขณะนี้สิ่งที่รู้ทั้งหมดมาจาก การวิเคราะห์แอปพลิเคชันและการรั่วไหลทางเทคนิคGoogle ยังไม่ได้ประกาศวันวางจำหน่ายหรือรูปแบบการใช้งานฟีเจอร์เพลงนี้อย่างเป็นทางการ แต่การที่ฟีเจอร์นี้ปรากฏอยู่ในแอปเวอร์ชัน 17.2.51.sa.arm64 แสดงให้เห็นว่าโครงการนี้ยังคงดำเนินอยู่ แต่ก็ยังอยู่ในช่วงการทดสอบภายในอยู่เช่นกัน
ยังต้องรอดูกันต่อไปว่าบริษัทจะเลือกใช้แนวทางใด การทยอยเปิดใช้งานในแต่ละประเทศ หรืออาจจะพยายามเปิดตัวเครื่องมือดังกล่าวพร้อมๆ กันในตลาดหลักๆ ในกรณีของสหภาพยุโรป ข้อกำหนดของกรอบการกำกับดูแล AI ในอนาคตและกฎหมายทรัพย์สินทางปัญญาในปัจจุบันอาจส่งผลต่อทั้งระยะเวลาและคุณสมบัติที่มีให้ใช้งานในแต่ละภูมิภาค
สำหรับผู้ใช้งานในสเปน การเปิดตัวฟีเจอร์นี้จะเปิดทางเลือกใหม่ที่ผสานรวมเข้ากับสภาพแวดล้อมของ Google อย่างลงตัว เมื่อเทียบกับแพลตฟอร์มอื่นๆ ที่มีอยู่แล้ว เพลงประกอบที่สร้างขึ้นโดย AIความสามารถในการทำงานโดยตรงจากแอป Gemini การซิงค์ผลงานสร้างสรรค์กับบัญชี Google และการเข้าถึงผลงานเหล่านั้นจากอุปกรณ์ต่างๆ จะเป็นข้อได้เปรียบที่ใช้งานได้จริงมากกว่าการใช้บริการภายนอกที่กระจัดกระจาย
ยังไม่ชัดเจนว่า Google จะเลือกใช้โมเดลเศรษฐกิจแบบใด บริษัทอาจเสนอ... เวอร์ชันฟรีมีข้อจำกัดด้านคุณภาพหรือจำนวนแทร็กนี่อาจหมายถึงการสงวนประสบการณ์ที่สมบูรณ์ที่สุดไว้สำหรับผู้ที่จ่ายค่าสมัครสมาชิก หรือการวางการสร้างเพลงไว้ในหมวดหมู่ฟีเจอร์ระดับพรีเมียมตั้งแต่เริ่มต้น การตัดสินใจนี้จะเป็นตัวกำหนดอย่างมากว่าเทคโนโลยีนี้จะเข้าถึงประชาชนทั่วไปหรือไม่ หรือจะยังคงอยู่ในมือของผู้ที่จ่ายเงินสำหรับเครื่องมือ AI ขั้นสูงอยู่แล้ว
หากการควบรวมกิจการได้รับการยืนยันในท้ายที่สุดและปัญหาทางกฎหมายได้รับการแก้ไขแล้ว คงไม่น่าแปลกใจหากในระยะสั้น ผู้สร้างเนื้อหาภาษาสเปนจะนำเพลงที่สร้างโดย Gemini ไปใช้ในวิดีโอสั้น พอดแคสต์ สื่อการศึกษา หรือการนำเสนอของบริษัทเช่นเดียวกับที่ผู้ช่วย AI ถูกนำมาใช้ในปัจจุบันเพื่อเขียนบท สรุปเอกสาร หรือสร้างภาพ การประพันธ์ดนตรีก็อาจกลายเป็นอีกก้าวหนึ่งในกระบวนการสร้างสรรค์ดิจิทัลนั้น
ทุกอย่างบ่งชี้ว่านี่คือความพยายามของ Google ที่จะทำให้การแต่งเพลงเป็นเรื่องง่ายสำหรับทุกคนที่มีโทรศัพท์มือถืออยู่ในกระเป๋า: ฟังก์ชันที่เขียนโค้ดเพียงไม่กี่บรรทัดเพื่อให้ Gemini ส่งคืนเพลงที่พร้อมเล่นได้โดยมีเงื่อนไขว่าบริษัทจะต้องปรับปรุงประสบการณ์การใช้งาน ชี้แจงกรอบกฎหมายให้ชัดเจน และตัดสินใจว่าจะทำให้ผู้ใช้ในสเปน ยุโรป และส่วนอื่นๆ ของโลกสามารถเข้าถึงบริการนี้ได้อย่างไร