{"id":16611,"date":"2026-04-01T14:14:53","date_gmt":"2026-04-01T06:14:53","guid":{"rendered":"https:\/\/www.oscoo.com\/?p=16611"},"modified":"2026-04-01T14:16:46","modified_gmt":"2026-04-01T06:16:46","slug":"turboquant-reshaping-the-ai-storage-landscape","status":"publish","type":"post","link":"https:\/\/www.oscoo.com\/pt\/news\/turboquant-reshaping-the-ai-storage-landscape\/","title":{"rendered":"TurboQuant: Reformulando o cen\u00e1rio de armazenamento de IA?"},"content":{"rendered":"<div data-elementor-type=\"wp-post\" data-elementor-id=\"16611\" class=\"elementor elementor-16611\" data-elementor-post-type=\"post\">\n\t\t\t\t<div class=\"elementor-element elementor-element-15b1e2a blog-post-container e-flex e-con-boxed e-con e-parent\" data-id=\"15b1e2a\" data-element_type=\"container\">\n\t\t\t\t\t<div class=\"e-con-inner\">\n\t\t\t\t<div class=\"elementor-element elementor-element-9c39110 elementor-widget elementor-widget-text-editor\" data-id=\"9c39110\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p>Em 24 de mar\u00e7o de 2026, a Google Research revelou oficialmente\u00a0<a href=\"https:\/\/research.google\/blog\/turboquant-redefining-ai-efficiency-with-extreme-compression\/\" target=\"_blank\" rel=\"noopener\"><span style=\"color: #00ccff;\"><strong>TurboQuant<\/strong><\/span><\/a>\u00a0- uma tecnologia de compress\u00e3o de IA inovadora que comprime a cache de valores-chave (KV Cache) utilizada durante a infer\u00eancia de modelos de linguagem de grande dimens\u00e3o at\u00e9\u00a0<strong>3 bits<\/strong>\u00a0precis\u00e3o. Desta forma, obt\u00e9m-se uma\u00a0<strong>Redu\u00e7\u00e3o de 6x na utiliza\u00e7\u00e3o da mem\u00f3ria<\/strong>\u00a0e at\u00e9 um\u00a0<strong>Aumento de 8x na velocidade de infer\u00eancia<\/strong>sem qualquer perda de precis\u00e3o do modelo. O an\u00fancio desencadeou uma volatilidade imediata no mercado global de chips de mem\u00f3ria, com o pre\u00e7o das ac\u00e7\u00f5es da Micron Technology a cair a pique e os principais intervenientes, como a Samsung e a SK Hynix, a sofrerem tamb\u00e9m, perdendo coletivamente mais de $90 mil milh\u00f5es em valor de mercado. O que torna esta tecnologia t\u00e3o poderosa? Ser\u00e1 que vai realmente perturbar o sector do armazenamento? Como \u00e9 que produtos de armazenamento como o <a href=\"\/pt\/news\/what-is-an-ssd-the-complete-guide\/\"><span style=\"color: #00ccff;\">SSDs<\/span><\/a>, DDR, e <a href=\"\/pt\/news\/hbm-the-high-bandwidth-revolution-reshaping-the-semiconductor-memory-landscape\/\"><span style=\"color: #00ccff;\">HBM<\/span><\/a> evoluir?<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-e19406b elementor-widget elementor-widget-image\" data-id=\"e19406b\" data-element_type=\"widget\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t\t\t\t\t\t\t<img fetchpriority=\"high\" decoding=\"async\" width=\"1400\" height=\"822\" src=\"https:\/\/www.oscoo.com\/wp-content\/uploads\/2026\/04\/turboquant-reshaping-storage-market-article-header-img-1400.webp\" class=\"attachment-full size-full wp-image-16649\" alt=\"\" srcset=\"https:\/\/www.oscoo.com\/wp-content\/uploads\/2026\/04\/turboquant-reshaping-storage-market-article-header-img-1400.webp 1400w, https:\/\/www.oscoo.com\/wp-content\/uploads\/2026\/04\/turboquant-reshaping-storage-market-article-header-img-1400-300x176.webp 300w, https:\/\/www.oscoo.com\/wp-content\/uploads\/2026\/04\/turboquant-reshaping-storage-market-article-header-img-1400-1024x601.webp 1024w, https:\/\/www.oscoo.com\/wp-content\/uploads\/2026\/04\/turboquant-reshaping-storage-market-article-header-img-1400-768x451.webp 768w, https:\/\/www.oscoo.com\/wp-content\/uploads\/2026\/04\/turboquant-reshaping-storage-market-article-header-img-1400-18x12.webp 18w, https:\/\/www.oscoo.com\/wp-content\/uploads\/2026\/04\/turboquant-reshaping-storage-market-article-header-img-1400-500x294.webp 500w, https:\/\/www.oscoo.com\/wp-content\/uploads\/2026\/04\/turboquant-reshaping-storage-market-article-header-img-1400-800x470.webp 800w\" sizes=\"(max-width: 1400px) 100vw, 1400px\" title=\"\">\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-3e6ec30 elementor-widget elementor-widget-heading\" data-id=\"3e6ec30\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">O que \u00e9 o TurboQuant?<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-76776a0 elementor-widget elementor-widget-text-editor\" data-id=\"76776a0\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p><strong>TurboQuant<\/strong>\u00a0\u00e9 um\u00a0<strong>algoritmo de quantiza\u00e7\u00e3o vetorial em linha sem forma\u00e7\u00e3o e sem enviesamento de dados<\/strong>\u00a0desenvolvido pela Google Research. Foi especificamente concebido para comprimir agressivamente o\u00a0<strong>cache de valores-chave (KV Cache)<\/strong> durante a infer\u00eancia de modelos lingu\u00edsticos de grande dimens\u00e3o.\u00a0<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-8384ec6 key-point elementor-widget elementor-widget-text-editor\" data-id=\"8384ec6\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p>A cache KV \u00e9 uma estrutura de dados tempor\u00e1ria que armazena informa\u00e7\u00f5es de contexto durante a infer\u00eancia do modelo. Cresce continuamente com conversas mais longas, tornando-se um estrangulamento cr\u00edtico que limita a capacidade de um modelo para lidar com sequ\u00eancias de texto longas. Os m\u00e9todos de compress\u00e3o tradicionais requerem frequentemente a reciclagem do modelo, grandes conjuntos de dados de calibra\u00e7\u00e3o ou armazenamento adicional para par\u00e2metros de quantiza\u00e7\u00e3o. <strong>A inova\u00e7\u00e3o do TurboQuant reside na sua capacidade de obter uma compress\u00e3o sem perdas de 16\/32 bits para 3 bits<\/strong> sem quaisquer ajustes de modelos, dados de treino ou sobrecarga de mem\u00f3ria adicional - uma verdadeira solu\u00e7\u00e3o \"plug-and-play\".<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-54d8c31 elementor-widget elementor-widget-heading\" data-id=\"54d8c31\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Arquitetura de compress\u00e3o em duas fases<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-59eca7f elementor-widget elementor-widget-text-editor\" data-id=\"59eca7f\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p class=\"ds-markdown-paragraph\">A principal inova\u00e7\u00e3o da TurboQuant \u00e9 a sua\u00a0<strong>estrutura de compress\u00e3o em duas fases<\/strong>que utiliza transforma\u00e7\u00f5es matem\u00e1ticas em vez de quantiza\u00e7\u00e3o de for\u00e7a bruta para alcan\u00e7ar um equil\u00edbrio ideal entre efici\u00eancia e precis\u00e3o:<\/p><ol start=\"1\"><li><p class=\"ds-markdown-paragraph\"><strong>PolarQuant<\/strong>: Esta \u00e9 a principal fase de compress\u00e3o, que transforma vectores de alta dimens\u00e3o de coordenadas cartesianas para coordenadas polares. Come\u00e7a por aplicar uma rota\u00e7\u00e3o aleat\u00f3ria aos vectores de entrada para tornar a distribui\u00e7\u00e3o dos dados mais uniforme. Em seguida, decomp\u00f5e cada vetor em\u00a0<strong>raio<\/strong>\u00a0(representando a magnitude) e\u00a0<strong>\u00e2ngulo<\/strong>\u00a0(representando a dire\u00e7\u00e3o sem\u00e2ntica), quantizando apenas o \u00e2ngulo. Este processo elimina completamente a necessidade de armazenar par\u00e2metros de normaliza\u00e7\u00e3o exigidos pelos m\u00e9todos tradicionais.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>QJL (Transformada Quantizada de Johnson-Lindenstrauss)<\/strong>: Esta \u00e9 a fase de corre\u00e7\u00e3o residual. Utiliza\u00a0<strong>1 bit<\/strong>\u00a0(bit de sinal) para aplicar uma corre\u00e7\u00e3o n\u00e3o enviesada aos pequenos erros introduzidos durante a fase PolarQuant, assegurando que a precis\u00e3o do c\u00e1lculo da aten\u00e7\u00e3o n\u00e3o \u00e9 comprometida. Esta etapa resolve o problema de acumula\u00e7\u00e3o de erros encontrado nos m\u00e9todos de compress\u00e3o tradicionais, tornando\u00a0<strong>perda de precis\u00e3o zero<\/strong>\u00a0teoricamente poss\u00edvel.<\/p><\/li><\/ol><p class=\"ds-markdown-paragraph\">Esta combina\u00e7\u00e3o de \"compress\u00e3o principal agressiva + corre\u00e7\u00e3o residual n\u00e3o enviesada\" permite ao TurboQuant atingir um desempenho de\u00a0<strong>Precis\u00e3o de 3 bits<\/strong>\u00a0que iguala ou excede mesmo as linhas de base de precis\u00e3o total, um facto validado por padr\u00f5es de refer\u00eancia como o LongBench.<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-23c0532 elementor-widget elementor-widget-heading\" data-id=\"23c0532\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Principais carater\u00edsticas e vantagens<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-7b8d06a elementor-widget elementor-widget-text-editor\" data-id=\"7b8d06a\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p class=\"ds-markdown-paragraph\">O TurboQuant destaca-se entre as t\u00e9cnicas de compress\u00e3o devido a quatro vantagens principais:<\/p><ul><li><p class=\"ds-markdown-paragraph\"><strong>N\u00e3o \u00e9 necess\u00e1ria forma\u00e7\u00e3o ou afina\u00e7\u00e3o<\/strong>: Pode ser aplicado diretamente aos modelos existentes (Llama, Mistral, Gemma, Gemini, etc.) sem qualquer ajustamento ou reciclagem, o que permite uma implanta\u00e7\u00e3o imediata.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>Dados imparciais<\/strong>: O seu desempenho \u00e9 independente da distribui\u00e7\u00e3o dos dados de entrada, funcionando eficazmente em todos os tipos de dados de texto, c\u00f3digo e imagem, sem necessidade de otimiza\u00e7\u00e3o espec\u00edfica do cen\u00e1rio.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>Zero despesas gerais<\/strong>: N\u00e3o requer armazenamento adicional para par\u00e2metros de quantiza\u00e7\u00e3o, factores de normaliza\u00e7\u00e3o, etc., o que contrasta fortemente com os m\u00e9todos tradicionais.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>Teoricamente \u00f3timo<\/strong>: Oferece garantias de distor\u00e7\u00e3o matematicamente quase \u00f3ptimas, proporcionando uma previsibilidade fi\u00e1vel do desempenho para uma implanta\u00e7\u00e3o em grande escala.<\/p><\/li><\/ul>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-e36d88b elementor-widget elementor-widget-heading\" data-id=\"e36d88b\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Nuvem sobre o Halo: uma breve nota sobre a controv\u00e9rsia acad\u00e9mica<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-e8c99af elementor-widget elementor-widget-text-editor\" data-id=\"e8c99af\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p class=\"ds-markdown-paragraph\">A par das ondas de choque no mercado causadas pela TurboQuant, surgiu uma disputa acad\u00e9mica. A 27 de mar\u00e7o, Jianyang Gao, p\u00f3s-doutorado na ETH de Zurique, <a href=\"https:\/\/x.com\/gaoj0017\/status\/2037552350924042488\"><span style=\"color: #00ccff;\">alegou publicamente que a metodologia principal da TurboQuant \u00e9 muito semelhante \u00e0 da RaBitQ<\/span><\/a>, um algoritmo que publicou em 2024 na SIGMOD. Gao salientou que o artigo da equipa da Google evitava discutir semelhan\u00e7as metodol\u00f3gicas, depreciava os resultados te\u00f3ricos do RaBitQ como \"sub\u00f3ptimos\" sem justifica\u00e7\u00e3o e utilizava compara\u00e7\u00f5es experimentais injustas (testando o RaBitQ numa CPU de n\u00facleo \u00fanico enquanto testava o TurboQuant numa GPU A100).<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-ae606ea elementor-widget elementor-widget-text-editor\" data-id=\"ae606ea\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p class=\"ds-markdown-paragraph\">De acordo com Gao, estes problemas foram comunicados \u00e0 equipa da Google por correio eletr\u00f3nico antes da publica\u00e7\u00e3o do documento. Embora a equipa da Google tenha reconhecido alguns problemas, apenas prometeu fazer correc\u00e7\u00f5es ap\u00f3s a confer\u00eancia e negou as semelhan\u00e7as t\u00e9cnicas. Em 31 de mar\u00e7o, a equipa do RaBitQ tinha <a href=\"https:\/\/openreview.net\/forum?id=tO3ASKZlok\" target=\"_blank\" rel=\"noopener\"><span style=\"color: #00ccff;\">publicou um coment\u00e1rio p\u00fablico no ICLR OpenReview<\/span><\/a> e apresentou uma queixa formal ao comit\u00e9 de \u00e9tica da confer\u00eancia do ICLR. Esta controv\u00e9rsia serve como um lembrete: O valor t\u00e9cnico do TurboQuant ainda precisa de tempo para ser totalmente validado e as quest\u00f5es de conduta acad\u00e9mica envolvidas s\u00e3o igualmente dignas de nota.<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-314b0f0 elementor-widget elementor-widget-heading\" data-id=\"314b0f0\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Impacto potencial no sector do armazenamento<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-7fa199f elementor-widget elementor-widget-heading\" data-id=\"7fa199f\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h3 class=\"elementor-heading-title elementor-size-default\">Um olhar racional sobre a rea\u00e7\u00e3o do mercado<\/h3>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-5be3039 elementor-widget elementor-widget-text-editor\" data-id=\"5be3039\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p class=\"ds-markdown-paragraph\">A queda acentuada dos stocks de chips de armazenamento ap\u00f3s o an\u00fancio da TurboQuant foi mais uma\u00a0<strong>rea\u00e7\u00e3o exagerada impulsionada pelo sentimento do mercado<\/strong>\u00a0do que uma avalia\u00e7\u00e3o racional. Para compreender o verdadeiro impacto, \u00e9 fundamental definir primeiro o conceito de\u00a0<strong>\u00e2mbito de influ\u00eancia<\/strong>:<\/p><ol start=\"1\"><li><p class=\"ds-markdown-paragraph\"><strong>Afecta apenas a infer\u00eancia<\/strong>: N\u00e3o tem impacto no processo de treinamento do modelo, que \u00e9 o cen\u00e1rio de demanda principal para a mem\u00f3ria de ponta como a HBM.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>Comprime apenas a cache KV<\/strong>: Os pesos do modelo, as activa\u00e7\u00f5es e outros dados principais n\u00e3o s\u00e3o afectados. Estes representam os principais consumidores de recursos de armazenamento.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>O paradoxo dos ganhos de efici\u00eancia<\/strong>: A experi\u00eancia hist\u00f3rica sugere que as melhorias na efici\u00eancia computacional conduzem frequentemente a aplica\u00e7\u00f5es de maior escala, potencialmente\u00a0<strong>crescente<\/strong>\u00a0a procura global de armazenagem em vez de a diminuir (paradoxo de Jevons).<\/p><\/li><\/ol>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-b16271d elementor-widget elementor-widget-heading\" data-id=\"b16271d\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h3 class=\"elementor-heading-title elementor-size-default\">Impactos potenciais em SSD, DDR e HBM<\/h3>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-9d81995 elementor-widget elementor-widget-text-editor\" data-id=\"9d81995\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p><strong>O TurboQuant pode ter uma mem\u00f3ria DDR de duplo impacto. <\/strong>Por um lado, reduz a depend\u00eancia do HBM, permitindo que o cache KV seja armazenado de forma mais econ\u00f3mica em <a href=\"\/pt\/news\/ddr4-vs-ddr5-ram-evolution-or-revolution\/\"><span style=\"color: #00ccff;\">DDR5<\/span><\/a>\/DDR6 em vez de exigir o caro HBM. Isso cria novas oportunidades para DDR5-8800+ de alta largura de banda e <a href=\"\/pt\/news\/ddr6-preview-the-future-blueprint-of-memory-technology\/\"><span style=\"color: #00ccff;\">futura DDR6<\/span><\/a>posicionando-os como uma alternativa econ\u00f3mica ao HBM em servidores de IA. Por outro lado, o TurboQuant acelera a ado\u00e7\u00e3o da tecnologia de expans\u00e3o de mem\u00f3ria CXL. Ao agrupar a mem\u00f3ria DDR via CXL, os servidores de IA podem alocar recursos de mem\u00f3ria de forma mais flex\u00edvel para lidar com tarefas de infer\u00eancia de tamanhos variados, aumentando ainda mais a efici\u00eancia da utiliza\u00e7\u00e3o de DDR e a demanda do mercado.<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-4c0c609 elementor-widget elementor-widget-text-editor\" data-id=\"4c0c609\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p class=\"ds-markdown-paragraph\"><strong>Ao contr\u00e1rio das preocupa\u00e7\u00f5es do mercado, o TurboQuant \u00e9 provavelmente um desenvolvimento positivo significativo para os SSDs:<\/strong><\/p><ol start=\"1\"><li><p class=\"ds-markdown-paragraph\"><strong>Armazenamento de transbordo de contexto longo<\/strong>: Quando a cache KV excede a capacidade da mem\u00f3ria, as SSDs de baixa lat\u00eancia e alta resist\u00eancia (como o modo pSLC, NVMe 4.0\/5.0) tornam-se a cache secund\u00e1ria ideal, aumentando significativamente a procura de desempenho e capacidade das SSDs de n\u00edvel empresarial.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>Expans\u00e3o da Base de Dados Vetorial<\/strong>: A crescente ado\u00e7\u00e3o de sistemas RAG (Retrieval-Augmented Generation), impulsionada pelo TurboQuant, ir\u00e1 alimentar diretamente o crescimento das bases de dados vectoriais, que dependem fortemente de SSDs de elevado desempenho para o seu armazenamento subjacente.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>Implementa\u00e7\u00e3o da IA de ponta<\/strong>: O TurboQuant torna poss\u00edvel executar modelos de IA em dispositivos de consumo, expandindo o mercado de SSDs do lado do cliente, aumentando particularmente a demanda por baixo consumo de energia e alto desempenho <a href=\"\/pt\/news\/what-is-an-m-2-ssd-not-just-smaller-but-faster-and-more-powerful\/\"><span style=\"color: #00ccff;\">SSDs M.2<\/span><\/a>.<\/p><\/li><\/ol>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-e94bfbe elementor-widget elementor-widget-text-editor\" data-id=\"e94bfbe\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p class=\"ds-markdown-paragraph\"><strong>O p\u00e2nico do mercado em rela\u00e7\u00e3o \u00e0 HBM parece ter sido exagerado:<\/strong><\/p><ol start=\"1\"><li><p class=\"ds-markdown-paragraph\"><strong>Distin\u00e7\u00e3o clara entre forma\u00e7\u00e3o e infer\u00eancia<\/strong>: TurboQuant s\u00f3 afeta o cache KV durante a infer\u00eancia. As exig\u00eancias de largura de banda para o treinamento de modelos no HBM permanecem inalteradas; o HBM continua sendo um requisito essencial para o treinamento de modelos de escala ultra-grande.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>Armazenamento do peso do modelo n\u00e3o afetado:<\/strong> Os pesos dos modelos, que representam mais de 90% do consumo de mem\u00f3ria da IA, n\u00e3o s\u00e3o comprimidos pelo TurboQuant. O papel do HBM como o principal meio de armazenamento desses pesos permanece seguro.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>Otimiza\u00e7\u00e3o da arquitetura h\u00edbrida<\/strong>: O TurboQuant permite que os recursos HBM sejam alocados de forma mais eficiente para tarefas cr\u00edticas de computa\u00e7\u00e3o, promovendo o desenvolvimento de arquiteturas de armazenamento h\u00edbridas que combinam HBM, DDR e SSD, em vez de uma simples substitui\u00e7\u00e3o.<\/p><\/li><\/ol>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-78ba107 elementor-widget elementor-widget-heading\" data-id=\"78ba107\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Potencial novo paradigma para a infraestrutura de IA<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-cc90e3c elementor-widget elementor-widget-text-editor\" data-id=\"cc90e3c\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p>O verdadeiro valor do TurboQuant n\u00e3o reside na \"elimina\u00e7\u00e3o\" de um tipo espec\u00edfico de armazenamento, mas na reformula\u00e7\u00e3o da arquitetura de armazenamento em camadas da infraestrutura de IA, conduzindo \u00e0 cria\u00e7\u00e3o de uma hierarquia de armazenamento de mem\u00f3ria mais eficiente e econ\u00f3mica.<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-d110139 elementor-widget elementor-widget-heading\" data-id=\"d110139\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h3 class=\"elementor-heading-title elementor-size-default\">Uma nova ordem de fluxo de dados inteligente<\/h3>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-7d0a461 elementor-widget elementor-widget-text-editor\" data-id=\"7d0a461\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p class=\"ds-markdown-paragraph\">\u00c9 prov\u00e1vel que as futuras arquitecturas de armazenamento de servidores de IA apresentem uma clara pir\u00e2mide de tr\u00eas n\u00edveis:<\/p><ol start=\"1\"><li><p class=\"ds-markdown-paragraph\"><strong>Top Tier - HBM<\/strong>: Respons\u00e1vel pelo armazenamento de dados computacionais essenciais, como pesos e activa\u00e7\u00f5es de modelos, satisfazendo as exig\u00eancias de largura de banda intensiva das tarefas de forma\u00e7\u00e3o e infer\u00eancia.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>N\u00edvel interm\u00e9dio - DDR<\/strong>: Actua como o suporte principal para a cache KV. Beneficiando da efici\u00eancia de compress\u00e3o do TurboQuant, a DDR5\/DDR6 tornar-se-\u00e1 a\u00a0<strong>mem\u00f3ria de trabalho<\/strong>\u00a0para cen\u00e1rios de infer\u00eancia.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>Escal\u00e3o inferior - SSD<\/strong>: Lida com transbordamento de contexto longo, bases de dados vectoriais e pontos de verifica\u00e7\u00e3o de modelos. As SSDs empresariais de baixa lat\u00eancia e alta resist\u00eancia encontrar\u00e3o novas oportunidades de crescimento.<\/p><\/li><\/ol><p class=\"ds-markdown-paragraph\">O n\u00facleo desta arquitetura em camadas \u00e9\u00a0<strong>coloca\u00e7\u00e3o inteligente de dados<\/strong>\u00a0- movendo dinamicamente os dados entre camadas com base na frequ\u00eancia de acesso, nos requisitos de lat\u00eancia e no custo de armazenamento para alcan\u00e7ar o equil\u00edbrio ideal entre desempenho e custo.<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-9c9d61b elementor-widget elementor-widget-heading\" data-id=\"9c9d61b\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h3 class=\"elementor-heading-title elementor-size-default\">A ascens\u00e3o do armazenamento definido por software<\/h3>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-f0112e8 elementor-widget elementor-widget-text-editor\" data-id=\"f0112e8\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p class=\"ds-markdown-paragraph\">A TurboQuant pode acelerar a ado\u00e7\u00e3o de <strong>Armazenamento definido por software (SDS)<\/strong>\u00a0na IA, nomeadamente nos seguintes dom\u00ednios:<\/p><ol start=\"1\"><li><p class=\"ds-markdown-paragraph\"><strong>Sistemas de gest\u00e3o de mem\u00f3ria<\/strong>: O software de gerenciamento que pode monitorar o tamanho do cache KV em tempo real e decidir de forma inteligente se os dados devem ser mantidos no HBM, DDR ou transbordados para SSDs se tornar\u00e1 um componente padr\u00e3o da infraestrutura de IA.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>Pooling de mem\u00f3ria CXL<\/strong>: O agrupamento de recursos de mem\u00f3ria DDR de v\u00e1rios servidores atrav\u00e9s do protocolo CXL fornecer\u00e1 recursos de mem\u00f3ria elasticamente escal\u00e1veis para clusters de IA, reduzindo ainda mais o requisito de capacidade HBM por servidor individual.<\/p><\/li><li><p class=\"ds-markdown-paragraph\"><strong>Armazenamento com capacidade de compress\u00e3o<\/strong>: Os dispositivos de armazenamento come\u00e7ar\u00e3o a suportar nativamente algoritmos de compress\u00e3o como o TurboQuant, permitindo a r\u00e1pida compress\u00e3o e descompress\u00e3o de dados ao n\u00edvel do hardware para melhorar a efici\u00eancia geral do sistema.<\/p><\/li><\/ol>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-fbe14eb elementor-widget elementor-widget-shortcode\" data-id=\"fbe14eb\" data-element_type=\"widget\" data-widget_type=\"shortcode.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"elementor-shortcode\"><a href=\"\/pt\/oscoo-leading-ssd-manufacturer\/\"><img decoding=\"async\" src=\"\/wp-content\/uploads\/2025\/09\/oscoo-2b-banner-1400x475-1.webp\" style=\"widht:100%;\" alt=\"\" title=\"\"><\/a><\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-28fa511 conclusion elementor-widget elementor-widget-text-editor\" data-id=\"28fa511\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p>O lan\u00e7amento do TurboQuant n\u00e3o \u00e9 um press\u00e1gio de desgra\u00e7a para a ind\u00fastria de armazenamento, mas sim um\u00a0<strong>novo ponto de partida para uma integra\u00e7\u00e3o mais profunda entre o armazenamento e a IA<\/strong>. N\u00e3o ir\u00e1 simplesmente \"eliminar\" um determinado tipo de produto de armazenamento. Em vez disso, atrav\u00e9s de um avan\u00e7o revolucion\u00e1rio na tecnologia de compress\u00e3o, conduzir\u00e1 a ind\u00fastria do armazenamento para uma maior efici\u00eancia e intelig\u00eancia. Isto significa que os futuros servi\u00e7os de IA ser\u00e3o capazes de lidar com textos mais longos, fornecendo respostas mais precisas e reduzindo potencialmente os custos de hardware. A verdadeira revolu\u00e7\u00e3o tecnol\u00f3gica nunca tem a ver com uma simples substitui\u00e7\u00e3o, mas sim com um salto na efici\u00eancia da utiliza\u00e7\u00e3o de recursos atrav\u00e9s da inova\u00e7\u00e3o, abrindo assim portas a aplica\u00e7\u00f5es mais vastas.<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>A 24 de mar\u00e7o de 2026, a Google Research apresentou oficialmente a TurboQuant - uma tecnologia de compress\u00e3o de IA disruptiva que comprime a KV Cache. O an\u00fancio desencadeou uma volatilidade imediata no mercado global de chips de mem\u00f3ria.<\/p>","protected":false},"author":4,"featured_media":16648,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"set","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[52],"tags":[],"class_list":["post-16611","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-industry-news"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.oscoo.com\/pt\/wp-json\/wp\/v2\/posts\/16611","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.oscoo.com\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.oscoo.com\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.oscoo.com\/pt\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/www.oscoo.com\/pt\/wp-json\/wp\/v2\/comments?post=16611"}],"version-history":[{"count":0,"href":"https:\/\/www.oscoo.com\/pt\/wp-json\/wp\/v2\/posts\/16611\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.oscoo.com\/pt\/wp-json\/wp\/v2\/media\/16648"}],"wp:attachment":[{"href":"https:\/\/www.oscoo.com\/pt\/wp-json\/wp\/v2\/media?parent=16611"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.oscoo.com\/pt\/wp-json\/wp\/v2\/categories?post=16611"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.oscoo.com\/pt\/wp-json\/wp\/v2\/tags?post=16611"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}