Os trabalhos relacionados aos novos métodos de triagem, diagnóstico, avaliação clínica e instrumental com o uso de tecnologias disruptivas já são uma realidade na fonoaudiologia (Sejdic et al., 2020).
Pesquisadores procuram meios seguros, objetivos e sustentáveis de levar para a clínica formas de facilitar a identificação da disfagia, assim como determinar seus riscos.
A videofluoroscopia (VDF) vem se mostrado um campo de estudo promissor para o uso das novas tecnologias, e as pesquisas se esmeram em procurar padrões de imagens em grupos populacionais com determinados agravos (Jones et al., 2018), correlacionar seus dados com outros exames de imagem, além de fornecer ao clínico maior facilitação para a detecção dos padrões de anormalidade da biomecânica da deglutição (Lee et al. 2020).
Os dados matemáticos coletados nos exames de imagem, permitem otimizar a precisão de algoritmos em vários níveis de análise computacional, trazendo aos métodos de avaliação instrumental a possibilidade de detecção de padrões de anormalidade de forma rápida e objetiva (Lee, Park e Jung, 2019).
Jones et al. (2018) usaram técnicas de Redes Neurais Artificiais para diferenciar pacientes com Doença de Parkinson (DP) em diferentes estágios, de pacientes saudáveis, usando comparação entre dados de imagens de exames de VDF e manometria faríngea de alta resolução.
Os resultados foram categorizados e essas classificações permitiram a normatização de padrões que destacaram as diferenças entre a função de deglutição em pacientes com DP em fases precoce e intermediária.
As pesquisas com aprendizado de máquina vêm fornecendo a possibilidade de desenvolvimento de modelos computacionais cada vez mais precisos no estudo da biomecânica da deglutição.
Em 2019, Lee, Park e Jung utilizaram uma abordagem de redes convolucionais em três dimensões (3D) para detectar o tempo da fase faríngea em VDF de forma automática, onde o modelo proposto pelos pesquisadores superou modelos anteriores, diminuindo consideravelmente o tempo de exame e diminuindo os índices de falhas.
Em 2020, Lee et al. (2020) apresentaram uma nova metodologia capaz de detectar ausência ou o tempo de resposta retardado do reflexo de deglutição em pacientes com disfagia.
O desempenho e a capacidade de generalização do modelo, foi realizada com taxas médias de sucesso de detecção durante o reflexo da deglutição, e para os conjuntos de dados de treinamento e validação, tiveram a acurácia estimada em 98,2% e 97,5%, respectivamente.
Segundo Zhang, Coyle e Sejdić (2018), o deslocamento do osso hióide é um dos principais componentes avaliados no estudo da deglutição por VDF, uma vez que sua movimentação durante a deglutição está relacionada à integridade global da função. No estudo dos autores supracitados foi possível desenvolver um método automático capaz de detectar e classificar a localização do osso hióide na sequência de vídeos, por meio de uma rede neural convolucional profunda. Os resultados experimentais mostraram que o método utilizado detectou o osso hioide com uma precisão média de 89,14% e superou outros algoritmos de auto detecção, o que pode ser considerado acurado o suficiente para ser amplamente aplicado como etapa de prévia para processamento de imagens em pesquisas sobre disfagia, bem como pode ser útil no diagnóstico clínico da disfagia.
Zhang et al. (2021) treinaram uma nova rede neural convolucional para localizar e medir os corpos vertebrais usando VDF de deglutição de 265 pacientes e o modelo produziu alta precisão, oferecendo mais opções para fonoaudiólogos em suas avaliações clínicas rotineiras da deglutição para a localização de pontos anatômicos em tempo real.
Kim et al. (2021) obtiveram desempenhos otimizados em termos de reconhecimento do quadro de fase faríngea, ou seja, acurácia de 93,20%, sensibilidade de 84,57%, especificidade de 94,36%, enquanto Ariji et al. (2022) criaram segmentações automáticas das áreas de imagem onde aparece o bolo alimentar, e com isso, o método apresentou alto desempenho para avaliação de penetração laríngea e aspiração.
No ano seguinte, Kim et al. (2023) coletaram dados da VDF de deglutição de 190 participantes com e sem disfagia, onde também aplicaram técnicas de rede neural convolucional para aprendizagem profunda de imagens de deglutição normal, penetração e aspiração e demonstraram que os algoritmos de aprendizagem profunda, podem ser aplicados para detectar a presença de penetração e aspiração nos exames de pacientes disfágicos.
A nasofibroscopia da deglutição também recebe atenção dos pesquisadores no intuito de trazer informações mais acuradas sobre o processo avaliativo das disfagias. Konradi et al. (2022) referem que a Avaliação Endoscópica Flexível da Deglutição (FEES) desempenha um papel fundamental no diagnóstico de aspiração, mas é propensa a erros humanos e por isso desenvolveram uma ferramenta baseada em IA. explicável para detectar aspiração em FEES. Os autores ensinaram a IA sobre as estruturas anatômicas relevantes e a detecção de bolos alimentares aspirados, com base em 92 exames de FEES Durante os testes, a IA reconheceu com sucesso a glote e as pregas vocais, mas ainda não foi capaz, neste trabalho, de alcançar uma qualidade satisfatória de detecção de aspiração. Embora o desempenho da detecção deva ser otimizado, os autores acreditam que a arquitetura proposta resultou em um modelo final que explica a avaliação da deglutição, localizando quadros significativos com eventos de aspiração relevantes e destacando deglutições suspeitas.
Os trabalhos de Weng et al. (2022) foram mais promissores ao propor um modelo baseado em aprendizado de máquina para analisar exames de FEES a fim de detectar de penetração, aspiração, resíduo em valécula e resíduo na hipofaringe. Os autores relataram que os experimentos abrangentes em múltiplas tarefas de classificação mostraram que o modelo foi eficaz com o uso de imagens em pixel desde que estas tivessem a iluminação adequada, visto que os dados de imagem são sensíveis ao contraste de cores.
A ausculta cervical de alta resolução (High Definition Cervical Auscultation - HRCA) é um método não invasivo e vem sendo considerada promissora para rastreamento de disfagia e detecção de aspiração, pois não envolve o uso de abordagens nocivas à radiação ionizante, como no caso da VDF, e não é invasivo como a nasofibroscopia. Métodos atuais com uso de aprendizagem de máquina destes dados, e tem inspirado o diagnóstico automático com algoritmos avançados, permitindo a extração automática dos eventos da deglutição na ausculta cervical, e é um passo fundamental para que a análise da deglutição seja clinicamente eficaz (Sejdic et al., 2022).
Sabry et al. 2020 utilizaram um sistema baseado em sensores de HRCA e técnicas avançadas de aprendizado de máquina, que permitiram a análise de sinais da ausculta, por meio de extração de recursos e algoritmos complexos. Um modelo de aprendizagem profunda de máquina (deep learning) foi desenvolvido com um conjunto de dados de 588 deglutições de 120 pacientes com suspeita de disfagia e posteriormente testado em 45 deglutições de 16 participantes saudáveis. A nova técnica obteve uma acurácia média global de 74,90%.
No mesmo ano, 2020, Khalifa, Coyle, e Sejdić, usaram estimativas espectrais variáveis no tempo de sinais de deglutição e redes neurais de avanço profundo para propor um algoritmo de segmentação automática para acelerometria e sons da deglutição que atuava diretamente nos sinais brutos de deglutição de forma online. O algoritmo foi validado qualitativa e quantitativamente utilizando os dados de deglutição coletados de 248 pacientes, obtendo-se mais de 3000 deglutições gravadas manualmente por fonoaudiólogos experientes. Com uma precisão de detecção superior a 95%, o algoritmo mostrou desempenho superior em comparação aos algoritmos existentes e demonstrou sua generalização quando testado em 76 deglutições completamente inéditas de uma população diferente.
Frakking et al. (2022) explicaram que o uso de aprendizado de máquina, foi utilizado para analisar a precisão dos sons de ausculta cervical alterada em crianças, e teve por objetivo investigar a acurácia na diferenciação entre sons da deglutição normal e disfágica, de gravações da ausculta cervical digital. Foram analisadas 106 deglutições normais de 23 crianças saudáveis e 18 deglutições alteradas que realizaram estudo videofluoroscópico concomitante da deglutição. A máquina treinada encontrou alta acurácia na diferenciação dos sons alterados e normais da deglutição com 98% de acurácia geral, elevando em 20 pontos os resultados de estudos anteriores. A sensibilidade para detecção de aspiração e sons normais da deglutição foi de 89% e 100%, respectivamente.
Shu et al. (2022), realizaram uma validação cruzada em 2079 conjuntos de características do sinal acústico por HRCA. O algoritmo foi validado qualitativa e quantitativamente utilizando os dados de deglutição coletados de 248 pacientes e com uma precisão de detecção superior a 95%. O grande número de dados propostos, proporcionou o aprendizado e aprimoramento significativo do algoritmo, demonstrando o notável potencial da melhora do desempenho da classificação utilizando tais sinais. Mediante estimativas espectrais variáveis e redes neurais de aprendizagem profunda, os autores propuseram algoritmos de segmentação automática que atuaram diretamente nos sinais brutos de deglutição de forma online.
Suzuki et al. (2022) utilizaram a ausculta cervical por meio de estetoscópio digital combinado com sistema de IA que incorpora o reconhecimento sonoro e desenvolveram um algoritmo de indexação dos sons de entrada do bolo alimentar utilizando IA, que comparou os sons da deglutição e criou um novo índice. Um software de análise acústica confirmou que o índice de deglutição foi significativamente maior em homens do que em mulheres, bem como na posição sentada do que na posição supina.
Além da ausculta cervical, videofluoroscopia e nasofibroscopia, outras formas de análise da deglutição são encontradas na literatura. O estudo de Inoue, et al. (2018), desenvolveu um método de avaliação da deglutição por meio detecção e análise de sinais de fluxo respiratório, movimento laríngeo e sons da deglutição com sensores simples para monitorar a função da deglutição durante a vida diária do indivíduo. A análise foi realizada por meio de sinais gravados usando um método de extração de características (codificação preditiva linear) e um método de aprendizado de máquina (máquina de vetor de suporte). Com base nos resultados para 140 indivíduos saudáveis e 52 pacientes com disfagia, o método proposto conseguiu atingir sensibilidade de 82,4% e especificidade de 86,0%, mostrando que a combinação dos sensores, pode ser eficiente na avaliação não invasiva da deglutição.
Kuramoto, et al., 2020 desenvolveram um instrumento portátil de avaliação da deglutição, com análise de dados em deep learning, que tem por objetivo o monitoramento em tempo real no smartphone utilizando os sons da deglutição. Foram analisadas as mudanças das habilidades de deglutição ao longo do tempo, registrando os sons da deglutição duas vezes para os mesmos participantes em uma instituição asilar. O resultado deste trabalho verificou ser possível utilizar o dispositivo como monitor de riscos de disfagia.
Roldan-Vasco et al. (2018), apresentaram um esquema de classificação de duas fases da deglutição (oral e faríngea) baseado em sinais da eletromiografia de superfície (EMGs). Os dados obtidos da deglutição de 47 indivíduos saudáveis, ingerindo água e iogurte e saliva, permitiu a extração de 9 características do domínio do tempo e 4 do domínio da frequência da deglutição, que foram analisados por meio de sistemas dois diferentes sistemas de aprendizado de máquina, que geraram acurácia de 92,03% e 90,26% respectivamente. As características do domínio do tempo apresentaram melhor capacidade de representação do que suas contrapartes no domínio da frequência. Os resultados experimentais mostram que o método proposto baseado na EMGs pode distinguir corretamente entre as fases oral e faríngea da deglutição e pode ser utilizado para avaliação de tarefas contínuas de deglutição.
Chantaramanee et al. (2022) propuseram um estudo observacional com o objetivo de investigar relações entre as características e a função da língua, classificando imagens ultrassonográficas da língua, usando um algoritmo de agrupamento comparando a função da língua, a pressão da língua e a diadococinesia oral para /ta/ e /ka/ em um grupo de 236 idosos saudáveis. Após análise dos gráficos de espessura e intensidade de eco, as línguas foram classificadas em três grupos. Os resultados indicam que a classificação ultrassonográfica das características da língua usando um modelo computacional matemático, pode auxiliar os clínicos a selecionar a estratégia de tratamento apropriada. De fato, a ultrassonografia é vantajosa por fornecer imagens em tempo real e não invasivas, o que pode melhorar o acompanhamento do paciente tanto no ambulatório quanto em casa.
Feng, et al (2021). utilizaram algoritmos de rastreamento baseados em deep learning e filtros de correlação para detectar a localização do hioide em vídeos de ultrassom da deglutição coletados e analisados de forma não simultânea. Cinquenta vídeos foram coletados de 10 indivíduos jovens e saudáveis para treinamento, avaliação e teste dos rastreadores. O algoritmo de aprendizagem profunda demonstrou ter desempenho confiável na obtenção de localizações precisas do osso hióide e alcançou uma precisão de 98,9% no limite de 10 píxeles (3,25 mm) e 80,5% no limite de 5 píxeles (1,63 mm). Os autores referem que os resultados abrem caminho para o rastreamento automático em tempo real do osso hióide em vídeos ultrassonográficos para avaliação da deglutição.
Pesquisadores brasileiros também contribuíram no uso de tecnologias disruptivas para detectar a movimentação do osso hióide com a ajuda do Ultrassom. Lopes, M. et al. (2019) apresentaram resultados confiáveis para análises com o paciente em repouso, mantendo o osso estático, e durante a deglutição, onde os pacientes foram orientados a engolir três tipos de líquidos: saliva, água e líquido pastoso, deslocando assim o osso hióide.
Park, et al. (2022) correlacionam com precisão as alterações de voz, (gravada via dispositivo móvel) com risco de alimentação por sonda e pneumonia aspirativa pós-AVC, através do uso de algoritmos de aprendizado de máquina. Foram obtidas 449 amostras, sendo 234 de pacientes com necessidade de alimentação por sonda e 113 com alto risco de complicações respiratórias. Os modelos multimodais, que incluíram características acústicas e variáveis clínicas anormais, mostraram altos níveis de sensibilidade na classificação daqueles com risco de alimentação por sonda e com alto risco de complicações respiratórias. Em ambos os casos, as características vocais mostraram-se os fatores contribuintes mais fortes nesses modelos. As características vocais podem ser consideradas biomarcadores digitais viáveis naqueles com risco de complicações respiratórias relacionadas à disfagia pós-AVE.
e-Dysphagia
Copyright © 2023 e-Dysphagia – Todos os direitos reservados.
Desenvolvido por GoDaddy
Usamos cookies para analisar o tráfego do site e otimizar sua experiência nele. Ao aceitar nosso uso de cookies, seus dados serão agregados com os dados de todos os demais usuários.