Sumário executivo
- PMEs importam para a economia brasileira e já usam IA generativa em suas operações: micro, pequenas e médias empresas respondem por cerca de 27% do PIB brasileiro; pesquisas nacionais indicam adoção crescente de IA para ganhos de produtividade (automação, marketing, RH, atendimento) e melhoria da qualidade do trabalho.
- Qualidade dos modelos de IA depende de dados: LLMs aprendem com grande volume, diversidade e qualidade de dados; restrições autorais que reduzem esse insumo tendem a afetar a precisão e a qualidade dos modelos disponíveis.
- Cenário regulatório restritivo: a lei brasileira de direitos autorais não prevê exceções para mineração de dados, prática essencial para treinar modelos de IA. O PL 2.338/2023, marco legal de IA, propõe uma exceção limitada e mecanismos tecnicamente inviáveis de aplicar na prática, o que pode desestimular o uso de dados nacionais no treinamento desses sistemas e impactar a qualidade percebida pelos usuários finais.
- Risco distributivo para PMEs: como dependem de modelos de IA disponíveis no mercado (não treinam os próprios), as PMEs podem ser as primeiras a sentir impactos em perdas de qualidade, reduzindo ganhos de produtividade e competitividade.

Introdução
O debate regulatório sobre inteligência artificial (IA) e direitos autorais tem sido conduzido, em grande parte, a partir da perspectiva das grandes empresas de tecnologia, que desenvolvem os modelos, e da indústria criativa, preocupada com o uso e remuneração de suas obras no treinamento desses sistemas.
Essa é uma perspectiva legítima — afinal, as principais desenvolvedoras de grandes modelos de linguagem (LLMs) são também grandes empresas globais. Contudo, essa narrativa corre o risco de deixar em segundo plano outros agentes relevantes: as micro, pequenas e médias empresas (PMEs).
As PMEs desempenham papel estratégico na economia brasileira, respondendo por aproximadamente 27% do PIB nacional (Agência Sebrae, 2025). Apesar disso, permanecem em posição vulnerável quando o assunto é inovação tecnológica, com menos recursos para investir em infraestrutura própria ou soluções de ponta (Brito, 2025).
Nos últimos anos, empresas brasileiras, inclusive as PMEs, vêm incorporando ferramentas de inteligência artificial em suas rotinas para inovar, automatizar processos e ganhar produtividade (Cetic.br, 2025).
Porém, esse movimento de transformação digital pode ser comprometido por regras mais restritivas de direitos autorais, que limitem o uso de dados, essenciais para o treinamento de sistemas de IA. Nesse ensaio exploratório, vamos trazer alguns dados para entender (i) como a IA funciona e o papel de dados para a qualidade das aplicações, (ii) o cenário regulatório no Brasil, e (iii) quais os potenciais impactos para PMEs.

1. Como a IA funciona e por que os dados importam para sua qualidade?
Para compreender os impactos de uma regulação autoral mais restritiva, é necessário entender como funciona a IA generativa (IAG) e por que os dados usados em seu treinamento são determinantes para a qualidade dos resultados.
As camadas da IA generativa
A economia da IAG pode ser entendida como um ecossistema em camadas complementares (Ramos; Barreto; Garrote, 2025):
- Infraestrutura: fabricantes de chips e data centers de alto desempenho, que fornecem a base de processamento.
- Modelos: empresas que desenvolvem e treinam os grandes modelos de linguagem (Large Language Models – LLMs), redes neurais com bilhões de parâmetros ajustados a partir de vastos conjuntos de dados.
- Aplicações: soluções construídas sobre os modelos e entregues aos usuários finais, como chatbots, copilotos de código, ferramentas de marketing e sistemas de atendimento.
As três camadas se articulam, mas é na camada dos modelos que o papel dos dados se torna decisivo. Para entender por que o acesso a dados de qualidade importa, é preciso olhar para como esses modelos “aprendem”.
A lógica da aprendizagem dos modelos
Os LLMs podem ser imaginados como um “super aluno”. Em vez de aprender com alguns livros, eles precisam ler bilhões de textos, imagens ou sons para reconhecer padrões, aprender vocabulário, estilos e contextos. Quanto maior e mais diverso o material estudado, maior a capacidade desse “aluno” de responder bem a diferentes perguntas e situações.
O estudo do Reglab (Ramos; Barreto; Garrote, 2025), baseado em entrevistas com profissionais técnicos das áreas de ciência e tecnologia (STEM), mostra que três fatores são centrais para o desempenho dos modelos:
- Qualidade: dados com erros ou lacunas comprometem as inferências do modelo, levando à reprodução de distorções ou omissões;
- Diversidade: variedade de idiomas, estilos e contextos é essencial para respostas inclusivas e generalizáveis;
- Quantidade: em modelos neurais, “quanto mais dados, melhor” — mas quantidade sem diversidade gera redundância e limitações.
A redução de dados disponíveis para treino foi apontada como um risco direto à qualidade dos modelos. Quanto menor a base, mais limitado o universo que o sistema poderá representar, resultando em respostas menos precisas e menos adaptadas a diferentes contextos (Ramos; Barreto; Garrote, 2025). **
Dados, qualidade e vieses
Estudos internacionais reforçam essa lógica. O relatório da OCDE (2023) observa que “modelos de linguagem treinados com pequenos volumes de dados funcionam pior do que aqueles treinados com grandes volumes”. Outro estudo (Naveed et al., 2024) confirma que o desempenho dos LLMs cresce de forma previsível à medida que aumentam o tamanho do modelo, o volume, a diversidade de dados e a capacidade computacional disponível.
Além da perda de precisão, a escassez de dados também intensifica vieses. Quando o treinamento se concentra em determinados grupos ou culturas, os padrões aprendidos refletem essas assimetrias. Buolamwini e Gebru (2018) mostraram que sistemas comerciais de classificação de gênero apresentaram taxas de erro muito maiores para pessoas de pele mais escura e mulheres, devido à falta de exemplos representativos. Em modelos de linguagem, efeitos semelhantes ocorrem: menos dados levam à “alucinação” de respostas, maior reprodução de estereótipos e menor capacidade de lidar com variações culturais ou linguísticas (Marwala, 2023).
Os LLMs funcionam, portanto, como uma infraestrutura digital: são a base sobre a qual diferentes aplicações são construídas. Na superfície desse ecossistema estão os usuários desses modelos disponíveis no mercado — que vão desde pessoas físicas até empresas de diferentes portes. Nesse conjunto, as micro, pequenas e médias empresas (PMEs) ocupam um lugar relevante, pois dispõem de menos condições técnicas ou financeiras para treinar modelos próprios e acabam recorrendo a essas soluções prontas para sustentar sua competitividade. Eventuais quedas na qualidade dos LLMs tenderiam a afetar de forma mais imediata as empresas que dependem diretamente desses modelos para inovar e crescer.
Figura 1. Fluxo de funcionamento de modelos de IAG: impacto dos dados de treinamento ao valor gerado para usuários finais.

2. O cenário regulatório no Brasil
As discussões sobre direitos autorais e regulação de IA podem influenciar diretamente a forma como modelos de IA generativa são desenvolvidos. Observamos como essas legislações e propostas estão sendo conduzidas no Brasil, visto que seu desenho pode impactar tanto a qualidade dos modelos disponíveis quanto as possibilidades de aplicação em diferentes setores da economia.
Assim como a maior parte da América Latina, o Brasil conta com legislação autoral mais restritiva (Schirru et al., 2024) inexistindo exceções que permitam práticas de mineração de dados (Flynn et al., 2022) — fundamentais para treinar modelos de IA generativa. Essa ausência cria um cenário restritivo para usos técnicos, científicos e comerciais de dados.
Em contraste, países como os Estados Unidos contam com a doutrina do fair use, que tem permitido práticas de mineração de dados, enquanto o Japão e Singapura introduziram exceções para mineração de dados, inclusive com fins comerciais (Ribeiro; Garrote, 2025). Já a União Europeia, por meio da Diretiva 790/2019, criou exceções específicas para TDM, ainda que sujeitas a limitações e mecanismos de opt-out por parte dos autores (União Europeia, 2019).
No Brasil, a discussão mais recente ocorre em torno do Projeto de Lei 2.338/2023, que discute um marco regulatório para a IA (Brasil, 2023). O texto propõe uma exceção restrita: permite a mineração de dados apenas para instituições científicas, educacionais, museus, arquivos e bibliotecas, sujeita ao direito de opt-out pelos titulares. Fora desse contexto, os detentores de direitos poderiam vetar o uso de suas obras para treinamento de IA, inclusive de forma retroativa, isto é, mesmo após o conteúdo já ter sido utilizado no processo de aprendizagem.
Além disso, o texto atual do PL prevê a possibilidade de remuneração proporcional por obra utilizada a partir da mineração de dados. Na prática, isso levanta um desafio técnico: de acordo com profissionais de STEM, monitorar e remunerar proporcionalmente cada uso em processos massivos de mineração de dados ainda não é tecnicamente viável (Ramos; Barreto; Garrote, 2025). De forma análoga, seria como tentar medir, ao cortar uma fatia de bolo, exatamente a proporção de cada ingrediente que a compõe. Em modelos de IA, que extraem padrões de bilhões de exemplos, esse cálculo proporcional se torna impraticável.
Esse desenho regulatório levanta duas preocupações centrais. A primeira é que, diante da inviabilidade técnica, desenvolvedores podem optar por não treinar modelos com dados brasileiros — o que deixaria os sistemas menos ajustados à realidade local. A segunda é que a exceção proposta para a prática de mineração de dados abrange apenas instituições acadêmicas e culturais, mas não contempla a maior parte da pesquisa e desenvolvimento (P&D) feita no país. Em 2023, por exemplo, a iniciativa privada respondeu por quase metade do dispêndio nacional em P&D (Brasil, 2025), e ficaria de fora dessa autorização.
Com isso, o Brasil se insere no grupo de países com baixa permissividade regulatória em relação à mineração de dados. Em termos práticos, é capaz de significar, ao final da cadeia, ferramentas de IAG de qualidade inferior disponíveis no mercado brasileiro e no impacto para organizações e usuários finais.

3. O impacto para pequenas e médias empresas
O debate regulatório sobre inteligência artificial atravessa setores da economia e toca diretamente na produtividade e competitividade de empresas em áreas diversas. O Relatório Econômico da ECOA (Almeida et al., 2025), mostrou que a inteligência artificial pode ser uma alavanca significativa de ganhos de produtividade em atividades criativas, industriais e de serviços. A tecnologia permite automatizar processos, reduzir custos, ampliar a escala de produção de conteúdo e apoiar decisões com maior precisão. Esses efeitos representam uma oportunidade concreta de crescimento econômico.
Ao mesmo tempo, o estudo também aponta que uma regulação que limite o acesso a dados para treinamento pode reduzir a qualidade dos modelos de IA disponíveis no Brasil e, com isso, comprometer parte desses ganhos de produtividade. Esse dado sugere que, independentemente do tamanho do negócio, há uma oportunidade de crescimento, e, ao mesmo tempo, um risco de perda caso restrições normativas reduzam a qualidade dos modelos disponíveis no Brasil.
As micro, pequenas e médias empresas (PMEs) brasileiras também têm buscado em ferramentas de IA generativa uma forma de ganhar produtividade e ampliar sua competitividade. Pesquisas recentes confirmam essa tendência:
- 47% das PMEs no Brasil já utilizam ou planejam utilizar IA em seus processos (Serasa Experian, 2024).
- Entre as que adotaram, os resultados estão se mostrando positivos: 91% relataram melhoria na qualidade do trabalho, com incremento médio de 48% na produtividade (Microsoft Brasil, 2024, p. 24).
- As aplicações de IA mais comuns nas empresas incluem automatização de fluxos de trabalho, nas áreas de marketing ou vendas, segurança digital, suporte a RH, recrutamento e gestão de empresas (Cetic.br, 2025, p. 105).
Mesmo com esse potencial, os benefícios ainda não se distribuem de forma homogênea. Enquanto 67% das grandes empresas brasileiras já relatam resultados positivos com IA, esse percentual cai para 52% entre as médias e menos de 45% entre as micro e pequenas (Edelman, 2024, p. 11).
Conforme a pesquisa TIC Empresas (Cetic.br, 2025, p. 76), a diferença está ligada à capacidade de investimento: grandes empresas ampliam infraestrutura e equipes, enquanto as menores enfrentam custos elevados de implementação e falta de profissionais especializados. Não por acaso, entre as empresas que ainda não utilizam IA, um dos obstáculos mais citados é a percepção de que os custos são muito altos (Cetic.br, 2025, p. 82).
Estudos internacionais ajudam a ampliar esse quadro. Nos Estados Unidos, 36% das PMEs afirmam que a IA as ajudou a competir com empresas maiores, e aquelas que adotaram a tecnologia registraram um aumento de 12 pontos na probabilidade de crescimento de lucros em relação às que não adotaram (U.S. Chamber of Commerce Technology, 2023).
Um estudo econômico conduzido na China (Mao et al., 2025) identificou uma correlação positiva entre o uso de IA generativa, inovação e crescimento econômico em PMEs: a inovação aparece como mediadora parcial, indicando que os ganhos econômicos decorrem, em parte, da capacidade de gerar novos produtos, processos e modelos organizacionais. Já na América Latina, a Microsoft LATAM destacou que a democratização da IA oferece às PMEs acesso a capacidades antes restritas a grandes corporações, fortalecendo sua competitividade e eficiência (Microsoft Source Latam, 2025).
Esse conjunto de evidências sugere que, apesar de barreiras de custo e qualificação, as PMEs podem ser um dos segmentos que mais têm a ganhar com a adoção de IA generativa em suas operações — tanto pela oportunidade de ganhos de produtividade como pela possibilidade de competir em condições menos desiguais com grandes empresas.
Por outro lado, também podem ser as mais vulneráveis em cenários de restrição regulatória. Diferentemente das grandes empresas, que podem treinar ou customizar modelos próprios, as PMEs dependem em maior medida de ferramentas “de prateleira”, muitas vezes em versões acessíveis ou gratuitas. Caso legislações autorais mais restritivas reduzam a diversidade e a qualidade dos modelos disponíveis, as empresas menores podem ser as primeiras a sentir os efeitos.

Conclusão
Diante desse cenário, cabe questionar se uma regulação mais restritiva do uso de dados para treinamento de sistemas de IA generativa realmente impactaria apenas grandes desenvolvedoras ou a remuneração do setor criativo. Ao limitar a base de dados disponível, essas normas podem levar a modelos de IAG menos precisos, menos criativos e menos adaptados às necessidades do mercado local.
Para as PMEs, que dependem de soluções acessíveis e muitas vezes gratuitas, por não terem condições de desenvolver ou contratar modelos próprios de alta performance, os efeitos de uma eventual queda na qualidade seriam sentidos de forma mais imediata. Vale, então, ponderar se regras restritivas e tecnicamente desafiadoras ampliariam desigualdades tecnológicas, restringindo a competitividade dos negócios que sustentam grande parte da economia brasileira.
Referências
ABREU, Carlos. De GPS a Chat GPT: maioria dos pequenos negócios abraça a inteligência artificial para aumentar resultados. Agência Sebrae, jun. 2025. Disponível em: https://agenciasebrae.com.br/inovacao-e-tecnologia/de-gps-a-chat-gpt-maioria-dos-pequenos-negocios-abraca-a-inteligencia-artificial-para-aumentar-resultados/#:~:text=O Sebrae identificou ainda o,20.
AGÊNCIA SEBRAE. PIB demonstra aceleração econômica. Pequenos negócios fazem parte do resultado positivo. 30 mai. 2025. Disponível em: https://agenciasebrae.com.br/economia-e-politica/pib-demonstra-aceleracao-economica-pequenos-negocios-fazem-parte-do-resultado-positivo/.
ALMEIDA, Silvia F. de; TAKAHASHI, Gabriel S.; MOREIRA, Miguel S.; OLIVEIRA, Lara de. Impactos do PL 2338/2023: mensuração da redução de ganhos de produtividade decorrente da remuneração de direitos autorais proposta sobre o uso de IA. Observatório de Direitos Autorais e Tecnologia, 2025. Disponível em: https://observatorio.cc/pl-de-ia-pode-gerar-perda-de-r-218-bilhoes-ao-pib-brasileiro-em-10-anos/
BRASIL. Câmara dos Deputados. Projeto de Lei n. 2.338, de 2023. Dispõe sobre o desenvolvimento, o fomento e o uso ético e responsável da inteligência artificial com base na centralidade da pessoa humana. Brasília, DF, 2023. Disponível em: https://www.camara.leg.br/proposicoesWeb/prop_mostrarintegra?codteor=2868197&filename=PL 2338/2023.
BRASIL. Ministério da Ciência, Tecnologia e Inovação. Brasil: dispêndio nacional em pesquisa e desenvolvimento (P&D) em relação ao total de P&D e ao produto interno bruto (PIB), por setor institucional, 2000-2023. In: Indicadores Nacionais de Ciência, Tecnologia e Inovação – Recursos aplicados: indicadores consolidados. Brasília, DF: Governo Federal, 30 jul. 2025. Disponível em: https://www.gov.br/mcti/pt-br/acompanhe-o-mcti/indicadores/paginas/recursos-aplicados/indicadores-consolidados/2-1-3-brasil-dispendio-nacional-em-pesquisa-e-desenvolvimento-em-relacao-pd-e-produto-interno-bruto-por-setor-institucional.
BRICS BRASIL. New Industrial Revolution. Luciana Mancini: “Micro and small enterprises are the backbone of the BRICS economy”. 8 maio 2025. Disponível em: https://brics.br/en/news/luciana-mancini-micro-and-small-enterprises-are-the-backbone-of-the-brics-economy.
BRITO, Carina. Apenas 10% das pequenas empresas utilizam inteligência artificial nos negócios, diz pesquisa. Revista Pequenas Empresas & Grandes Negócios, 13 maio 2025. Disponível em: https://revistapegn.globo.com/gestao/noticia/2025/05/apenas-11percent-das-pequenas-empresas-utilizam-inteligencia-artificial-nos-negocios-diz-pesquisa.ghtml.
BUOLAMWINI, J; GEBRU, T. Gender shades: intersectional accuracy disparities in commercial gender classification. In: Conference on Fairness, Accountability, and Transparency, 2018. Proceedings of Machine Learning Research, v. 81, p. 1-15, 2018. Disponível em: https://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf.
CETIC.br. TIC Empresas: pesquisa sobre o uso das tecnologias de informação e comunicação nas empresas brasileiras – 2024. São Paulo: CETIC.br, 2025. Disponível em: https://cetic.br/media/docs/publicacoes/2/20250512122204/tic_empresas_2024_livro_eletronico.pdf.
EDELMAN. Artificial intelligence in the corporate world – regional report. jan. 2025. Disponível em: https://news.sap.com/latinamerica/files/2025/06/05/Regional-IA-in-the-corporate-world-External.pdf.
FIIL-FLYNN, Sean; et al. Legal reform to enhance global text and data mining research. Science, v. 378, p. 951-953, 2022. Disponível em: https://doi.org/10.1126/science.add6124.
MAO, Ningning; WEI, Jianxiu; ZHU, Xuanliang. Generative artificial intelligence and SMEs innovation: a driver of economic growth. International Journal of Economics, Business and Management Research, v. 9, n. 4, 2025. ISSN 2456-7760. DOI: https://doi.org/10.51505/IJEBMR.2025.9404.
MARWALA, Tshilidzi. Algorithm bias — synthetic data should be option of last resort when training AI systems. United Nations University (UNU), 28 jul. 2023. Disponível em: https://unu.edu/article/algorithm-bias-synthetic-data-should-be-option-last-resort-when-training-ai-systems.
MICROSOFT (Source Latam). IA continúa impactando positivamente las pequeñas y medianas empresas en Puerto Rico. News Center Microsoft Latinoamérica, 2 maio 2025. Disponível em: https://news.microsoft.com/es-xl/ia-continua-impactando-positivamente-las-pequenas-y-medianas-empresas-en-puerto-rico/#:~:text=“En esta nueva era de,haciéndolas más competitivas y eficientes”.
MICROSOFT (Source Latam). 75% das PMEs no Brasil estão otimistas sobre o impacto da inteligência artificial em seus negócios, aponta estudo da Microsoft. Microsoft, 7 maio 2025. Disponível em: https://news.microsoft.com/source/latam/features/noticias-da-microsoft/75-das-mpmes-no-brasil-estao-otimistas-sobre-o-impacto-da-inteligencia-artificial-em-seus-negocios-aponta-estudo-da-microsoft/?lang=pt-br.
MICROSOFT; EDELMAN. IA em micro, pequenas e médias empresas: tendências, desafios e oportunidades. Brasil, fev. 2024. Disponível em: https://msftstories.thesourcemediaassets.com/sites/42/2024/03/Microsoft_Edelman_PMEs_2023_Imprensa-Brasil-VF.pdf.
NAVEED, Humza et al. A comprehensive overview of large language models. out. 2024. Disponível em: https://arxiv.org/abs/2307.06435.
OCDE. AI language models: technological, socio-economic and policy considerations. (OECD Digital Economy Papers, n. 352). Paris: OECD Publishing, abr. 2023. Disponível em: https://www.oecd.org/content/dam/oecd/en/publications/reports/2023/04/ai-language-models_46d9d9b4/13d38f92-en.pdf.
RAMOS, P. H.; BARRETO, J.; GARROTE, M. Remuneração por Direitos Autorais em IA: Limites e Desafios de Implementação. Policy Briefs Reglab, n. 3. São Paulo: Reglab, 2025. Disponível em: https://reglab.com.br/remuneracao-por-direitos-autorais-em-ia-limites-e-desafios-de-implementacao/.
RIBEIRO, N.; GARROTE, M. Mapeamento Global de Leis de Direitos Autorais e Exceções para Mineração de Dados. Contexto Reglab. n. 1. Reglab, 2025. Disponível em: https://observatorio.cc/mapeamento-global-de-leis-de-direitos-autorais-e-excecoes-para-mineracao-de-dados/.
SCHIRRU, Luca; SOUZA, André Rocha de; VALENTE, Mariana G.; et al. Text and data mining exceptions in Latin America. International Review of Intellectual Property and Competition Law – IIC, v. 55, p. 1624-1653, jul. 2024. Disponível em: https://doi.org/10.1007/s40319-024-01511-2.
SERASA EXPERIAN. Quase metade das PMEs brasileiras usa ou pretende usar inteligência artificial (IA) em seu dia a dia, de acordo com pesquisa realizada pela Serasa Experian. 27 nov. 2024. Disponível em: https://www.serasaexperian.com.br/sala-de-imprensa/pmes/quase-metade-das-pmes-brasileiras-usa-ou-pretende-usar-inteligencia-artificial-ia-em-seu-dia-a-dia-de-acordo-com-pesquisa-realizada-pela-serasa-experian/.
U.S. CHAMBER OF COMMERCE TECHNOLOGY. Empowering small business: the impact of technology on U.S. small business. 2. ed. Washington, DC: U.S. Chamber of Commerce, 2023. Disponível em: https://www.uschamber.com/assets/documents/The-Impact-of-Technology-on-Small-Business-Report-2023-Edition.pdf.